人类、小鼠、新冠病毒(SARS-CoV-2)参考序列下载

2020-03-03  本文已影响0人  工医男

为了学习jimmy大神的视频,一直在努力重复他视频里的每一个步骤,结果linux都快学完了,才发现😅

image.png
哎,反正我已经折腾的差不多了,就这样吧,jimmy大神的东西真的很全,也很用心,但也正因为太全了,太用心了,每到一个点就恨不得把相关的都告诉你,再加上我是按照他的他视频的顺序(第一个为‘生信人应该这样学linux’,弹幕也有吐槽逻辑有时候有些混乱,后来发现还要学点他的别的视频)学习,并且这是他很早以前录制的,可能那时候还没有完全弄好学习的顺序,尤其是对于小白,我就一步一步为了实现他视频里所有的东西,用各种办法,加上自己的想法来处理,吃了很多苦。但,我觉得这些苦没有白吃,也收获了很多,等我他的第一部分彻底弄完(已经进行到P11),我会做个jimmy哥的整理版给大家,是可以真正重复他的视频的,希望对大家有帮助。
因为我觉得git是可以觉得,但是纯正的Linux不论是未来你做生信,还是想自己做点什么都是离不开的好工具(这是我吃了很多苦,同时也感觉到很多快乐),今天先给大家提供几个数据的下载,大家最好养成建立目录的习惯,不要乱存数据,否则后面很难找,也很难重复别人的视频,比如参考序列尽量放在一个reference的目录下,然后再逐级建立目录。

下载gh38

cd ~/reference
mkdir -p genome/hg38  && cd genome/hg38
nohup wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz  & 
gunzip hg38.fa.gz

命令说明

cd ~/reference #先进入reference目录,当然你没有的话cd reference建立一个就可以了

mkdir -p genome/hg38 && cd genome/hg38 #mkdir 是建立目录的意思,-P 是逐级建立,也就是再genome下再建立一个hg38;&& 是运行完前面的命令再运行后面的

nohup wget http://hgdownload.cse.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz & # nohup是你关闭这个输入终端,仍然运行的命令;wget是ubuntu的一个下载命令;网址是下载地址;&这个是不显示前端

gunzip hg38.fa.gz #这是解压缩.gz的命令

下载 hg19

cd ~/reference
mkdir -p genome/hg19  && cd genome/hg19
nohup wget ttp://hgdownload.cse.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz &
tar zvfx chromFa.tar.gz
cat *.fa > hg19.fa
rm chr*.fa

命令说明

这个和上面的区别是压缩文件不一样,这个是tar.gz,所以需要解压gz和同时处理tar
命令就是tar zvfx;解压缩完是好多个chr*.fa;cat有很多用处,在这里是讲多个文件合并为一个;rm是删除之前解压出来的fa

下载小鼠

cd ~/reference

mkdir -p  genome/mm10  && cd genome/mm10

nohup wget http://hgdownload.cse.ucsc.edu/goldenPath/mm10/bigZips/chromFa.tar.gz  &

tar zvfx chromFa.tar.gz

cat *.fa > mm10.fa

rm chr*.fa

命令说明

没啥说明的,和hg19一个意思

下载SARS-CoV-2基因组

多说一句,SARS-CoV-2这个是病毒名(这个是国际病毒分类委员会干的)COVID-19这个是疾病名(这个是WHO干的)不要搞混。当然命名是否合理是另一回事,确实容易有奇异,但也是有一定道理的,至少没像MERS(ME代表Middle East),来个WHRS这样就已经很庆幸了,这种利用最早发病地区命名的方式,是应该舍弃了,这种影响是无法估量的,但在数据库还是叫做wuhCor1,这个是2月7日上传的,而WHO命名是2月11日命名的,不能怪他。所以先按照他的方式下载下来,我们再自己改名字。

image.png
image.png
image.png

这个是我自己根据上面的方式(jimmy哥的帖子),自己尝试的也欢迎大家指正,反正是下来了,也做了bwa的index,后面的再说。

cd ~/reference
mkdir SARS-CoV-2 && cd SARS-CoV-2
nohup wget https://hgdownload.soe.ucsc.edu/goldenPath/wuhCor1/bigZips/chromFa.tar.gz &
tar zvfx chromFa.tar.gz

今天先到这里

上一篇下一篇

猜你喜欢

热点阅读