biostar handbook: 第三周笔记汇总+第四周任务布
2017-11-05 本文已影响155人
xuzhougeng
就目前来看,这一周主要以补交上次作业为主,所以上一周的总结增加了很多新内容。但是关于本体论和富集分析,大家还是有点小困难。当然我自己交东西也慢了很多,因为时间也总是不太够,完全靠周末挤出来。
第三周笔记汇总如下
第四周作业发布
我们处在大数据时代,尤其是测序技术诞生之后,测序仪生产的数据更是不可思议地多。那么问题来了,我们每个人都在说数据,但是数据(data)是什么呢?还有一个问题数据格式(data format)又是什么?数据那么多,你需要的数据存放在哪里,你需要到哪里才能找到这些数据呢?这些都是你这一周需要思考的问题。
第四周的任务是阅读第六章和第七章的内容。这部分内容比较简单,都是属于了解即可的内容。此外,这一周涉及到命令行操作的代码也有很多,可能需要一段时间去练习。
- 了解GenBank格式
- 了解FASTA/FASTQ格式,尤其是FASTA的命名方式
- 整理目前你已知的数据库
- 学会使用命令行访问NCBI
- 学会从数据库下载数据到本地,以SRA为例。