基因组数据分析利器之Bioconductor
2018-09-14 本文已影响12人
Boer223
Bioconductor
写在前面
在生物信息学领域,Perl,Python和Java算是三个欢喜冤家了,相应的它们的BioPerl, BioPython以及BioJava都做得很优秀,而对于R,Bioconductor在某种程度上可以算是BioR了。对于Bioconductor的出现,自然也是为了有效降低生物信息学的门槛。当前,随着生物信息学的发展,越来越多的数学方法及模型被引入到生物学当中来,另一方面,随着生物技术的发展,实验可以产生前所未有的高通量生物信息。如何方便而准确地使用数据工具来处理海量的生物信息,就成为Bioconductor最直接的目的。
简介
Bioconductor包含诸多分析和解释高通量基因组数据的工具包,几乎所有的工具包都是用R语言开发的,同时也是开源的,其每年发布两个版本。其他关于Bioconductor特点的详细介绍:
https://blog.csdn.net/shmilyringpull/article/details/8542607
Bioconductor目前包含的软件包主要可以分成四个大类:
- 软件工具包:共计1560个,包括各种芯片数据处理,NGS数据处理,差异分析等;
- 注释数据包:共计919个,包括各种ID的转换,kegg或者GO这样的功能注释,还有其它基因信息注释,转录本,外显子起始终止等;
- 实验数据包:共计342 个,包括SNP数据,疾病数据,物种组织数据和数据库数据等的分析包;
- 分析流程讲解包:共计21个流程,包括注释流程,表观遗传分析流程,基因表达分析流程等。
目标
鉴于现在Bioconductor中的许多工具包还没有详细使用教程,因此我会在我的简书及个人博客上长期不定时更新一些使用频率较高的工具包的教程,欢迎持续关注~~
参考: