GWAS全基因组关联分析:TASSEL 5.0 Windows版
2020-10-25 本文已影响0人
追梦生信人
TASSEL的官方网站:https://tassel.bitbucket.io/
在TASSEL的下载文件夹中...\TASSEL5\TutorialData有示例数据 用此数据进行演示
依次为基因型数据、亲缘关系、表现型数据(这里面包含了分群、表型性状、群体结构)、群体结构、表型性状。
实际只用到基因型数据、群体结构、和表型性状。TASSEL是可以通过基因型数据计算亲缘关系的。
一、加载数据
点击File → Open
将基因型数据、群体结构和表型性状导入进来。(mdp_genotype.hmp、mdp_phenotype、mdp_traits这三个文件)
图片2.png
二、计算亲缘关系
对基因型文件进行过滤
选择基因型数据 点击Filter → Sites
图片3.png
进行设置 → 点击Filter
图片4.png
(此处的标准都是按照TASSEL指导手册中进行设置的)
点击Analysis → Relatedness → Kinship
图片5.png
点击OK
图片6.png
就得到了亲缘关系的矩阵
图片7.png
三、关联分析(一般线性模型)
对基因型文件进行过滤
注意:这里用到的是上一步进行亲缘关系分析时过滤后的文件
在此文件的基础上再次进行过滤 点击Filter → Sites
设置过滤条件 点击Filter
图片9.png
得到过滤后的基因型数据
图片10.png
选择性状数据 点击Filter → Traits
图片11.png
选择其中一个性状,点击OK
图片12.png
得到其中一个表型数据 图片13.png
选择群体结构 点击Filter → Traits
将最后一个群体结构(Q3)去掉,指导手册中给出的解释是“如果我们把它们全部作为协变量使用,这会产生线性相依性”。
图片14.png
得到过滤后的群体结构数据 图片15.png
摁住Ctrl键同时选中上述三个文件进行合并 点击Data → Intersect Join
图片16.png
得到合并后的数据集
选中合并后的数据集 点击Analysis → Association → GLM
图片17.png
点击OK
图片18.png
其中Help选项中有该页面参数的解释和默认值,还可以点击User Manual查看更详细的内容。
得到最终结果文件 图片19.png
数据可视化
点击Results → QQ Plot/Manhattan Plot
图片20.png
图片21.png
图片22.png
四、关联分析(混合线性模型)
混合线性模型即将群体结构和亲缘关系作为协变量来进行分析
摁住Ctrl键同时选中上述提到的一般线性模型中合并后的数据集和亲缘关系矩阵
图片23.png
点击Analysis → Association → MLM
图片24.png
进行设置 点击RUN → 点击 OK
图片25.png
得到最终结果文件 图片26.png
数据可视化
点击Results → QQ Plot/Manhattan Plot
图片27.png
图片28.png
实际上关联分析输出的结果中只有Trait、Marker、Chr、Pos、p值是用到比较多的,Q-Qplot和曼哈顿图也是基于此几个值进行绘制的,我们可以将这几列提取出来在R语言中进行绘图。
图片29.png
参考:
https://bitbucket.org/tasseladmin/tassel-5-source/wiki/UserManual
Tassel5UserGuide