用tbtools进行基因家族分析《一》
2021-02-24 本文已影响0人
群体遗传学
此版本为无代码版本,依赖tbtools来实现,纯粹记录自己的学习经验。
蛋白序列的blast比对
- 选择拟南芥基因家族的蛋白序列文件
- 选择你想要查找的基因家族的基因组蛋白文件
- 选择你要输出的文件名
- 选择输出格式,默认为xml,选择"Table“格式,结果更直观
-
点击”start“,开始运行。
image.png
候选蛋白序列的提取
- 对于我们获得的结果文件
rice.txt
,我们选择用excel打开,对其进行排序和去重处理,得到候选的基因ID;
image.png -
选择TBtools的”Fasta Extract or Filter"功能来提取上述候选基因的蛋白序列,
image.png -
第一个红框为水稻基因组的蛋白序列,第二个为输出的文件名,第三个就是我们的上一步得到的候选基因ID;
image.png
候选基因的保守结构域确定
-
利用网站NCBI CD search来预测候选基因的保守结构域;
image.png
image.png -
根据结果来筛选候选基因,比如我们挑选的是
image.pngDUF629 superfamily
,其中包含DUF629 superfamily
的基因则为最终的候选基因。