linux 的三驾马车grep ,sed,awk
2020-12-03 本文已影响0人
呆呱呱
grep

只要出现gene字眼都查找出

精确查找,一个单词一个单词的搜索



用于找文件前缀
到file文件里面查找关键词
grep -w -f file

-n显示行号
正则表达式


-
只查找以“T”开头的行

-
模糊匹配的方法 f*ee
image.png
-
grep 'f?ee' 其中 \是转义符
表示f可以出现0次或1次, 查找fee 或者ee - 匹配1次或多次
grep 're+'
表示e可以出现1次或多次,查找 ree, re, ree等
- 匹配1次或多次
-
{n}匹配n次
image.png
-
列出以*结尾的文件
image.png
-
一般情况下*可以当做通配符
-
*表示出现0次或者1次
image.png
sed













1,练习题目


从第二行开始,使用y函数,ATCG对应TAGC,如果想要保存,利用重定向命令
awk
awk定义



循环语句


先匹配外显子的exon的行,第五列减去第四列

当用cut命令取第九列的时候,取得很多

基因前后的空格都被分割了,取出来
所以需要重新定义分隔符
-F分隔符被重新定义为制表符

打印关于UTR的所有列出来

print和print end 类似于在开头结尾加注释

