使用grep命令提取指定基因信息

2022-04-11  本文已影响0人  花生学生信

准备基因名称信息


基因名称

编写脚本

cat gene.txt |while read id 
do
grep ${id} pb_pav.tsv >> gene_pav.txt
done 

没有得到结果文件,使用cat -v 命令查看文件格式,发现结尾有^M的标记


编码问题

dos2unix是将Windows格式文件转换为Unix、Linux格式的实用命令。Windows格式文件的换行符为\r\n ,而Unix&Linux文件的换行符为\n. dos2unix命令其实就是将文件中的\r\n 转换为\n。

而unix2dos则是和dos2unix互为孪生的一个命令,它是将Linux&Unix格式文件转换为Windows格式文件的命令。

感谢梁同学提供的帮助

dos2unix gene.txt 

再次运行脚本,得到相关基因信息



发现没有表头,先把第一行提取出来就可以

awk 'NR==1' pb_pav.tsv >> gene_pav.txt

再运行脚本,得到结果信息:


上一篇下一篇

猜你喜欢

热点阅读