「摸鱼快报010」一个基于低覆盖度的全基因组测序的群体遗传学数据
摸鱼快报是一档致力于轻量化地收集优质生物信息学及相关领域资料带给大家的小栏目, 力求废话不多, 干货为王.
项目地址:
https://github.com/nt246/lcwgs-guide-tutorial
这个教程用到的数据是一种叫做Menidia menidia的小鱼(如下图所示), 内容涉及到数据处理(从fastq到bam文件)、Genotype和SNP calling(一时想不到怎么翻译成中文)、连锁不平衡分析、种群结构分析和自然选择分析的内容. 其实如果只是学习方法论的话, 什么数据都无所谓的啦~
image-20210312145553299Throughout this course, you will be working with data from the Atlantic silverside, Menidia menidia, a small estuarine fish.
把整个教程浏览完之后我的感觉是这个教程短小精悍, 内容看起来不多但是极其丰富.
比如说第一天教你从测序的fastq数据处理到bam文件, 也就是上游分析, 这个过程中提供了大量的shell脚本的写法, 是很好的学习用shell脚本来处理生物信息学数据的范例.
image-20210312183357853还有一个很有意思的发现: 这个教程里用于SNP calling的软件既不是主流认为的金标准软件GATK
或者是samtools+bcftools
的流程, 而是一个没怎么听说过的ANGSD
(Analysis of Next Generation Sequencing Data, 文章链接: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-014-0356-4)
奇怪的知识增加了~
后面的内容还没怎么看, 就留给感兴趣的各位自行发掘吧~
咱们下期再见~