用TBtools做物种内共线性分析(仅步骤)
2020-05-09 本文已影响0人
Devin561
主要是参考https://www.tinymind.net.cn/articles/64d36abc7fd091
首先我们拿到的是以下的材料
搜狗截图20200509201150.png
1. Blast比对
根据以下选择blast
blast_1.png
然后将豌豆的fasta文件自己和自己比对(一般Hits数最少选择5个)
blast_2.png
这个时间比较长,我电脑大概用了一个晚上
得到了以下文件,命名是自己命的,(额...豌豆的简写应该是Ps的,我最开始写的Pi,这个问题不大哈哈)
blast_3.png
2. 获得基因的位置信息
在搜索栏查找,然后点Text merge for MCScanx
MCScan_1.png
将blast结果简化
MCScan_2.png 得到Pisum_sativum.sim.gff文件
3. 进行自我比对
将tab文件和sim.gff文件放入quick run MCScanX Wrapper,设置好保存结果路径
得到的结果如下
MCScan_4.png
其中tandem用excel打开,电脑原因目前打不开了,如果打开,进行分列
方法参考https://baijiahao.baidu.com/s?id=1623642728105642204&wfr=spider&for=pc
选择根据步骤逗号处打钩
然后将第一列另存为存为txt格式
如下图
geneIDtext.png
获得基因间关系的link文件,用Text merge for MCScanX
links_1.png
同理,将link文件用excel打开进行分列,然后直接另存为txt
如图
links_2.png
4. 可视化
基因组已经组装到染色体的,就不需要分析scaffold了,所以把原始gff文件scaffold的行删除掉,只留下染色体,然后另存为Pisum_sativum_v1a_genes_del_scaffolfd.gff3(文件名)
gff_1.png
用circle gene view进行可视化
view.png
然后就会得到以下的图
view2.png
调整调整参数 颜色,得到以下图像
view3.png
...
大致的步骤就是这样,但是我们要看特定基因的共线性,那么只需要将circle gene view中的set input gene ID list改改成特定的gene文本就行
但是我们得到的gene list是这样的,这个gene list就是要看这些特定基因的共线性
gene1.png
但是links文件中是这样的
gene2.png
所以要处理以下gene的ID,将.1 .2等删掉,并且只留一个,如Psat1g090040.1和Psat1g090040.3,变成Psat1g090040,并且只留一个Psat1g090040
后续处理就不在此做了
...
结束