Java子弹 Linux open_source_unix_science

linux 的三驾马车grep ，sed，awk

2020-12-03 本文已影响0人呆呱呱

grep

image.png

只要出现gene字眼都查找出

image.png

精确查找，一个单词一个单词的搜索

image.png

image.png

image.png

用于找文件前缀

到file文件里面查找关键词
grep -w -f file

image.png

-n显示行号

正则表达式

image.png

image.png

只查找以“T”开头的行

模糊匹配的方法 f*ee

image.png
grep 'f?ee' 其中 \是转义符
表示f可以出现0次或1次，查找fee 或者ee
- 匹配1次或多次
  grep 're+'
  表示e可以出现1次或多次，查找 ree, re, ree等

{n}匹配n次

image.png

列出以*结尾的文件

image.png
一般情况下*可以当做通配符

*表示出现0次或者1次

image.png

sed

image.png

image.png

image.png

a命令.png

在第一行和第二行前面加一行.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

1，练习题目

image.png

image.png

从第二行开始，使用y函数，ATCG对应TAGC，如果想要保存，利用重定向命令

awk

awk定义

image.png

image.png

image.png

循环语句

image.png

image.png

先匹配外显子的exon的行，第五列减去第四列

当用cut命令取第九列的时候，取得很多

image.png

基因前后的空格都被分割了，取出来

所以需要重新定义分隔符

-F分隔符被重新定义为制表符

打印关于UTR的所有列出来

print和print end 类似于在开头结尾加注释

image.png

image.png

上一篇下一篇

猜你喜欢

热点阅读