生物信息学与算法TBtools攻略基因家族分析

生信小白如何半年内收到核心期刊的录用证明顺利毕业!!!

2022-01-24  本文已影响0人  Charon_7db5

生信小白如何在短短半年收到核心期刊的录用证明顺毕业!!!

本人农林院校的专硕研究生,学制2.5年,毕业要求是一篇核心及以上或者专利。硕士期间课题换了两次,实验数据不能支持发一篇研究论文,前期大量时间荒废没有知识储备写出综述,结合课题只能做一个物种的生信分析,保证毕业。当我知道这篇文章是我的“救命稻草”后,就开始疯狂问同学,找公众号,去b站……2021年5月22日买了陈程杰老师的基因家族分析课程,2021年8月24日完成论文的初稿,2021年11月29日收到投稿杂志的录用证明。

图中是用到的大部分软件和网站,使用最多的是TBtools也就是陈老师开发的强大的生物信息学分析工具(包括序列的提取,引物设计,基因结构保守域的可视化……总之功能很多,只有你不会用,而且软件一直在更新,免费的,大家可以自行搜索“生信药丸”公众号,使用讲解的很全面,保姆级别了);其余一些使用频率不是那么高的,VMD是蛋白三级结构模型预测的可视化软件,细节很足,可以自行探索;figtree和网站iTOL都是进化树的可视化,因为本人的基因家族成员接近400左右,实在很大,图片如果要清楚美观选择了后者,figtree应该也可以,但是本人未能摸透就放弃了;Jalview可以进行多序列的比对,对于其中的一些氨基酸位点可以根据需要用不同颜色进行高亮显示;MEGA可以序列比对再生成进化树,如果选择其他美化修饰软件,也是需要MEGA氨基酸序列比对后保存相关文件(.meg/.mtxs)导入才可。当然,还有其他的许多软件和网站,根据分析的需求进行选择和组合都是没有问题的。

本人的基因家族分析大体包括三个部分,基因家族成员的鉴定、基本理化性质的分析和家族成员进化分析。其中,基因家族成员的鉴定最为重要,也是反反复复比对后才确认。

首先,基因家族成员的鉴定包括:1. 研究的基因家族家族成员的基本特征确定(参考已有物种,我研究的是栽培花生,参考的是模式植物拟南芥,拟南芥二倍体植物,2n=10,该基因家族成员有100个左右,花生异源四倍体作物,2n=40,预估200以上,400左右)2. 目标物种序列和注释信息的下载(花生和拟南芥的基因组文件,基因组注释文件,共4个文件)3. 双向Blast比对获取可能的成员(TBtools软件进行提取后,上传序列至ncbi batch cdd/pfam/hmmer基于保守结构域进一步筛选)。

其次,是基因家族成员的基本分析包括1.成员理化性质分析(分子量,等电点,亲/疏水性,有无信号肽/跨膜结构域和亚细胞定位。可以做成表格,其他分析大都是图片的形式)2.基因染色体分布情况(成员在染色体上的分布做成图,每条染色体上基因成员的数量也可以统计做图)3.基因结构分析(外显子内含子分布及数量)和保守结构域分析(与确定家族成员重复,可视化更为直观,如果家族基因数量不多可以把两张图合并)。

最后,基因家族成员的进化分析,包括1.进化树构建与可视化(本人研究基因家族成员较大,亚家族分类与参考(拟南芥)/已知(水稻、小麦、葡萄和栎树)物种较为一致,暗示结果具有一定可靠性)2.物种内的共线性分析(可以看基因是否存在串联重复)3.不同物种之间的共线性分析(研究种间基因组同源性程度,抄过来的,通俗的理解是目标物种为A,现在做了ABC三个物种的共线性,其中AB共线性数量多于AC,说明A和B的亲缘关系更近)。

当然,以上内容仅为最基础的部分,其他更深入全面的分析如启动子的预测,三级结构模型的预测,部分实验qRT-PCR等等。如果你想发一篇好文章,这远远是不够的,只能说越早开始越好。以上是内容大概,后期发布详细分析过程。

上一篇下一篇

猜你喜欢

热点阅读