用R语言对vcf文件进行数据挖掘.1 前言
2021-07-28 本文已影响0人
Jason数据分析生信教室
众所周知,基因组分析的软件为了效率进行大规模的计算处理,大多数是基于C++。这对于用惯了R语言的同学就很不友好了。花了时间和钱做了分析拿到了vcf结果,还得去花时间去学处理vcf的linux软件,结果回报的是一大堆报错,可谓生产力低下。所以在此给同行小伙伴推荐一款R语言包vcfR
来轻松应对生信分析。谁说统计学工具不适合做基因组分析。
自己用vcfR
有一段时间,vcfR
不仅可以用来对数据进行可视化,过滤,还可以用来从复杂的vcf文件中提取自己想要的数据,重组成csv
文件轻松应对SNPs的样本比对。当然不止于此,最近发现vcfR
还可以用来做copy number variation(CNV)分析和未知物种的染色体倍数判定。有感于其功能之强大,一定要写点教程下来和小伙伴分享。
目录