生信基因家族分析基因进化

用TBtools做物种内共线性分析(仅步骤)

2020-05-09  本文已影响0人  Devin561

主要是参考https://www.tinymind.net.cn/articles/64d36abc7fd091

首先我们拿到的是以下的材料


搜狗截图20200509201150.png

1. Blast比对

根据以下选择blast


blast_1.png

然后将豌豆的fasta文件自己和自己比对(一般Hits数最少选择5个)


blast_2.png

这个时间比较长,我电脑大概用了一个晚上
得到了以下文件,命名是自己命的,(额...豌豆的简写应该是Ps的,我最开始写的Pi,这个问题不大哈哈)


blast_3.png

2. 获得基因的位置信息

在搜索栏查找,然后点Text merge for MCScanx


MCScan_1.png

将blast结果简化


MCScan_2.png 得到Pisum_sativum.sim.gff文件

3. 进行自我比对

将tab文件和sim.gff文件放入quick run MCScanX Wrapper,设置好保存结果路径

MCScan_3.png
得到的结果如下
MCScan_4.png
其中tandem用excel打开,电脑原因目前打不开了,如果打开,进行分列
方法参考https://baijiahao.baidu.com/s?id=1623642728105642204&wfr=spider&for=pc
选择根据步骤逗号处打钩
然后将第一列另存为存为txt格式
如下图
geneIDtext.png
获得基因间关系的link文件,用Text merge for MCScanX
links_1.png

同理,将link文件用excel打开进行分列,然后直接另存为txt
如图


links_2.png

4. 可视化

基因组已经组装到染色体的,就不需要分析scaffold了,所以把原始gff文件scaffold的行删除掉,只留下染色体,然后另存为Pisum_sativum_v1a_genes_del_scaffolfd.gff3(文件名)


gff_1.png

用circle gene view进行可视化


view.png

然后就会得到以下的图


view2.png
调整调整参数 颜色,得到以下图像
view3.png

...

大致的步骤就是这样,但是我们要看特定基因的共线性,那么只需要将circle gene view中的set input gene ID list改改成特定的gene文本就行

但是我们得到的gene list是这样的,这个gene list就是要看这些特定基因的共线性


gene1.png

但是links文件中是这样的


gene2.png
所以要处理以下gene的ID,将.1 .2等删掉,并且只留一个,如Psat1g090040.1和Psat1g090040.3,变成Psat1g090040,并且只留一个Psat1g090040
后续处理就不在此做了

...
结束

上一篇下一篇

猜你喜欢

热点阅读