我的生信入门

2020-12-03  本文已影响0人  奔跑的Forrest

1. 统计入门

作为生信的入门课程,统计学的学习比想象的更为重要
《医学统计学(第三版)》李晓松主编,看完前几章的基础部分,可以搭配《白话统计》一起看,完成统计学入门。

2. 计算机入门

(1)懂得基础的计算机知识,内存,cpu都是干什么的之类比较基础的知识。
(2)学会科学上网,有效的检索能力,参考我的博文 科研工作者如何合理使用谷歌浏览器
(3)基础的软件安装,合理的文件管理,环境变量的配置等基本操作,不会什么查什么

3. 生物信息学入门

(1) linux基本操作
掌握基础的命令,不会什么查什么,用的多了,慢慢的积累的就足够用了 ,可以参考我的文集 https://www.jianshu.com/nb/44780197
(2)Linux文本处理能力
这里需要掌握的是awk,sed,grep,被称为Linux文本处理三剑客的东西,基础的操作学会,后面还是需要什么查什么。

Linux.png

(3)掌握一门语言用于分析数据和可视化
这里对于普通的生信人员来说掌握 R 语言作为优先选项,其次可以学习 python 。但是随着在线平台的开发,现在很多网站都可以直接丢数据,然后直接出结果,如果不是往生信方向发展,感觉可以直接借助在线网站去做可视化,或者其他数据分析。相信以后肯定会有越来越多的网站,而且个性化操作也会越来越多,对于普通的湿实验人员来说是个好事情。
R 语言学习需要的参考书:
R for Beginners
R 数据科学
————————————————————————————————————
分享一些好用的可视化作图网站:
进化树作图网站—itol
Cytoscape: An Open Source Platform for Complex Network Analysis and Visualization
蛋白互作网络图_string
OmicShare Tools - 基迪奥生物信息绘图云平台
悟空:快速查看与分析数据云平台
还有很多网站可以,可以自行探索或者搜索,以上平台可以解决普通生信所需的绝大多数图

4. 复原一篇文章

用自己的电脑子系统构建生物信息学环境-1(Win10 Linux子系统的安装),或者一些云服务器或者自己的服务器尝试跑通一个流程。初学者基本都选择RNAseq流程,这里可以跟着视频网站学习,生信技能树,孟浩巍大佬(b站—鲮鱼不会飞,知乎平台—高通量测序专栏(可以学习里面的基础知识,有个一百问,虽然没有更完,但是前面讲了很多的基础知识很受用)),还有基因课张旭东老师的课,选择一个认真听下去,跟着复原每一步操作,理解每一步的目的。我跟的是孟浩巍大佬的课程,然后自己也做了笔记。学习课程每个人有每个人的讲课风格,找到合适的那个听下去就行,很多知识都是大同小异。学习期间涉及的知识需要自行检索的及时检索做好笔记(建议做电子笔记,有道云笔记,语雀等选一个用就行,如果想分享就用简书、CSDN等都可以,建议掌握 Markdown 语法,并不难,可以做出想要的笔记效果)。
完整转录组RNAseq分析流程(tophat2+cufflink+cuffdiff)
RNAseq 分析后 R 结果可视化volcano plot和heatmap(火山图和热图)
GO,KEGG,DO 富集分析

5. 小结语

这里只是作为一个同样是刚刚走上生信道路的小白的学习路径,可能会不断有新的更新或者其他感悟,目前就是这样。一年多的研究生生涯走来发现在这条路上能碰到贵人是你的荣幸,碰不到也没关系,最终很多是的事情还是需要靠自己去完成,很难找得到愿意无私奉献去帮助你的人。学习道路上尽管也走了一些弯路,尽管还是要干很多实验室的杂活,还有一些湿实验和一些生产实验,但是会一直抽出时间去学习,学习进程虽然缓慢(一些和我同时学习的同学已经走的很远很远),实验的方向也不清晰,或许人生的道路也是如此,落后与模糊。但是希望就像电影回到未来的台词那样Where we're going we don't need roads,我们的未来也是不需要沿着别人的路去走,自己也能走出一片天地。

上一篇下一篇

猜你喜欢

热点阅读