GWAS专题群体遗传学基因家族和关联分析

PLINK+TASSEL做GWAS+Post-GWAS分析

2021-10-13  本文已影响0人  Hello育种

此视频来自B站,是非常好和全的的一个GWAS操作的视频,从开始准备软件下载,数据过滤,到最后的候选基因注释。
GWAS的实战视频
https://www.bilibili.com/video/BV1f44y1t7Jk?from=search&seid=12908459299918140554&spm_id_from=333.337.0.0

LD


image.png

流程:


image.png image.png

怎么安装软件:


image.png image.png

VCF格式1:不需要填充:


image.png

VCF格式2(原始):需要处理:


image.png
首先基因型填充
image.png

填充后(PLNIK):


image.png image.png image.png

admixture: k = 1-13


image.png

根据VC,选取使用P文件


image.png

TASSEL:亲缘关系:


image.png

hapmap格式文件:


image.png

以下都为:TASSEL
VCF转为hapmap:

image.png

GLM使用时,要去除群体结构文件中的最后一列,需要保证三列和小于1.表型文件并且admiture的文件,在表型最前面加如covriances。


image.png

MLM加入亲缘关系:


image.png

表型数据中为单个表型:两列

安装R包


image.png

普通曼哈顿图:


image.png image.png

CMplot:


image.png

RColorBrewer包调控颜色:


image.png

筛选显著值:第二:峰中的其他位点是受最大的影响,所以进行clump清理,根据LD值处理。


image.png

染色体注释
上下100kb进行注释。
准备基因位置文件:


image.png

基因功能注释文件:


image.png

输入文件:


image.png

使用perl进行注释:
先基因定位:


image.png
image.png

再对基因进行功能注释:


image.png

有重复的需要删除。

对结果再行筛选
Camoco预测候选基因。安装软件


image.png

构建数据库


image.png
Camoco的文章:
image.png

建立参考基因组:


image.png image.png

GFF文件格式:


image.png image.png

需要将csv格式,使用最后代码将数据分开。
根系文件:


image.png

GO


image.png

计算:


image.png

test.txt


image.png

再进行GO富集分析,网站直接进行。

区段关联分析

image.png

PLINK(文件格式转换)和TASSEL(关联分析)进行(windows版本)。


image.png

VCF(基因文件)改为ped,map


image.png image.png

首先确定基因的目标区段:annotation文件:


image.png

从基因里查出内部及上下游50k的所得SNP


image.png

导入基因型:


image.png

关联分析:数据筛选


image.png

数据整合:


image.png

关联分析:


image.png

LD 分析:


image.png

根据TASSEL根据选出的SNP再次进行MLM分析,得到结果后,再次进行LD分析,

将基因型和关联分析结果导出。再使用R进行画图:
关联结果只需要marker,POS,P值,三列。
需要报: LDheatmap, genetics包,读数据:记得加as.is=T


image.png

p值转为-log10()

image.png
image.png

候选基因还是很多(GWAS步骤),可以构架一个WGCNA调控网络

基本概念:


image.png

主要数据:


image.png image.png

基本流程:输入数据
基因表达矩阵:


image.png

性状矩阵(必须为数值型数据)


image.png
上一篇 下一篇

猜你喜欢

热点阅读