如何学习生信
什么是bioinformatician
如何你想成为一名生信人,那么至少你需要了解什么叫做生物信息学。否者,朝着错误的方向再努力也是白费劲。
什么是生物信息学呢?在陈铭主编的《生物信息学》(科学出版社)的序中是这样写的:
生物信息学是20世界80年代末随着人类基因组计划的启动而兴起的一门新兴交叉学科,体现了生物学、计算机科学、数学、物理学等等学科间的渗透与融合。它通过对生物学实验数据的获取、加工、储存、检索和分析,达到解释数据所蕴含的生物学意义从而解读生命活动规律的目的。
百度词条是这样说的:
生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。
在维基百科中,是这样解释的
Bioinformatics is an interdisciplinary field that develops methods and software tools for understanding biological data. As an interdisciplinary field of science, bioinformatics combines computer science, statistics, mathematics, and engineering to analyze and interpret biological data. Bioinformatics has been used for in silico analyses of biological queries using mathematical and statistical techniques.
从这些有两个关键字:交叉学科,生物数据。
什么不是生物信息学,你可以思考如下问题:
- 如果一个程序员根据生物学家的解释,写出了一些代码用来计算进化树,他是bioinformatician么?
- 如果一个统计学家根据要求,来分析生物学试验中结果是否具有显著性意义,那么他是bioinformatican么?
- 如果一个研究生物的人,学了一些编程语言,然后用GWAS寻找QTL位点,那么他是bioinformatician么?
以上问题没有正确的答案,主要是我也想不出。
所以生物信息学是一个非常模糊的概念,以前看过一个段子,说只要你是一个搞生物的,到中关村买一台电脑,你都可以说自己是做生物信息学了。
回到原来的话题,那什么是bioinformatician呢?就我而言,你可以把bioinformatician看成一个音乐家。当音乐家听到一首曲子的时候,他可以根据自己的经验分析出这首曲子是如何演奏的,有哪些乐器,有没有其他表达方式。也就说bioinformatician应该了解他的数据,知道数据是如何来的,如何分析他的数据,懂得挑选方法。
如何成为bioinformatician
经过刚才的介绍,你可能对bioinformatician有了新的理解,当然光是知道是没用的,如何练习才是一个比较重要的问题。
继续用音乐家作比喻,成为一名音乐家必然是学习大量的乐理知识,至少熟练掌握了一门乐器,然后对其他的也有所涉及。因此成为一名bioinformatician也是如此,你需要对背景知识有一定的了解,然后不断学习一些工具,通过使用这些工具加深你对生物数据的理解,提高你的分析能力。
在学习之前,我们需要如何学习才是比较好的学习方式,如下是我认为比较好的学习方式:
学习姿势首先我们需要认可自己学生信真的是因为热爱,而不是老板逼你,学习的过程中你要觉得自己能够做好,每一次的错误都可以让你不断进步,另外,你学习的知识是有用的,无论是帮助实验室成员还是解决自己的课题。
然后你需要建立一个学习框架,用于总结存放你学习到的内容,我的学习框架如下:
框架构建你可以用专门的笔记软件或者直接手写,每天记录自己的学习信息,然后每隔一段时间进行总结,然后把总结的内容增加到自己的学习框架中。
在调整自己的学习态度,使用正确的学习方法后,我们就可以开始一步一步的学习了。一般而言,我们会很快忘记那些用不到的知识,所以学习的最好方式就是实战。么从下周一开始,我会整理出我是如何学习mapping-by-sequencing(MBS)。
为什么选择MBS呢?主要是我目前在学,而且mapping大家都比较熟悉,所以比较好介绍把。
个人经验(可以跳过)
这个部分主要是讲我为什么进入生物信息领域,你要是有兴趣的话,可以看下。
我目前是研一,大学的专业是农学,接触生物信息学这个概念是在大二下学期,当时问我们学校比较擅长做生物信息的老师要了PPT学习,当时接触也就是数据库查找,序列比对,进化树这些内容,所以我认为生物信息学就是拿一个软件跑跑数据就好了。后来我考上了研究生,在开学前到一个老师那里实习,一个非常nice的师姐听说我对生信感兴趣于是给了我RNA-Seq的数据和一篇文献(关于tophat的操作流程),然后我就回家开始学习,其实也是迷迷糊糊。开学的时候,我找了一本书叫做RNA-seq data analysis,比较系统介绍了RNA-Seq分析的具体流程,我如获至宝,不知疲倦的把书看了大半,但是数据还是没有分析出来。后来由于轮转制度,我去了另一个老师那里,那个老师听说我做过一点RNA-Seq,于是就放我继续折腾,这个时候我在美亚买了一本对我感触最大的书bioinformatics data skills,这本书让我真正的了解什么才算bioinformatician。
不过后来,又一次机缘巧合我知道了biostarhandbook,于是我看到了如下这张图
我对概念又一次重构。
现在的我认为学习一开始最重要,一个老司机带路,会让你对整个领域的理解都不一样,可以避免走很多不必要的弯路。但是入门之后就靠自己了,别人帮不了你。
推荐阅读:
一篇我总结的学习的正确姿势:http://www.jianshu.com/p/90168fa89c9a
MBS综述:http://www.nature.com/nrg/journal/v15/n10/full/nrg3745.html