生物数据分析生信log

生信log18|一个上传基因组到NCBI的图文详细教程

2021-09-14  本文已影响0人  小周的万用胶囊

开篇废话一下:> 这篇日志分享的实际上是我总结了NCBI基因组上传流程并分享给组内同学参考的PPT教程,当然我们PPT上面还有16S rRNA基因的上传教程,因为是师兄做的,此处不作分享,仅分享基因组上传的部分。上传基因组途中经历了一些波折和等待,也正好记录一些大家可以避开的坑。

1、NCBI基因组上传需要什么文件

2、序列文件的质量要求是什么

###seqkit 的安装
conda install -c bioconda seqkit
mamba install seqkit #上面哪一种都可以
    
#过滤序列长度小于1000bp的序列,参数-m 保留大于某个长度的序列(-m, -min-len int only print sequences longer than the minimum length (-1 for no limit) (default -1)
seqkit seq -m 1000 your_fasta_file

3、图文全程流程(以下的序号与NCBI的流程一致)

此处提醒一下,要上传数据就必须先注册账号

4、中间发生的一些小插曲(坑)

走过路过不要错过,各位看官不要手下留情,请使劲点赞👍

上一篇 下一篇

猜你喜欢

热点阅读