Fst的含义、计算与应用
一、Fst含义
群体间遗传分化指数(Fst):是种群分化和遗传距离的一种衡量方法,分化指数越大,差异越大。Fst居于0~1之间,越接近1表示两个群体之间分化程度越大,受选择程度越高,反之亦然。
二、Fst计算
#对每一个SNP变异位点进行计算(按单点计算)
vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2—single
#按照区域来计算
vcftools --vcf test.vcf --weir-fst-pop 1_population.txt --weir-fst-pop 2_population.txt --out p_1_2_bin --fst-window-size 500000 --fst-window-step 50000
test.vcf是SNP calling 过滤后生成的vcf 文件;
p_1_2_3 生成结果的prefix
1_population.txt是一个文件包含同一个群体中所有个体,一般每行一个个体。个体名字要和vcf的名字对应。2_population.txt 包含了群体二中所有个体。
--fst-window-size # 设置计算Fst的窗口大小,根据自己的数据进行设置,看看别人文章里怎么用的
--fst-window-step # 设置计算Fst的步长长度,根据自己的数据进行设置
我们也可以只计算每个点的Fst,去掉参数(–fst-window-size 500000 --fst-window-step 50000)即可。
![](https://img.haomeiwen.com/i27405822/7ee768452f793b52.png)
(群体中的Fst值-学习篇 - 百度文库 (baidu.com)
三、Fst值的范围
实际研究中,Fst为0~0.05:群体间遗传分化很小,可以不考虑;
Fst为0.05~0.15,群体间存在中等程度的遗传分化;
Fst为0.15~0.25,群体间遗传分化较大;
Fst为0.25以上,群体间有很大的遗传分化
四、 计算完了之后该干啥?
1、按窗口式计算Fst值的处理
在对两个群体之间进行不同区段的Fst计算之后,需要判断哪一些区段,是“真正”受到了选择压力,根据近期看的文章,得到可以选择前5%的作Fst为一个阈值,对区域进行划分,高于该阈值的被认为受到了选择压力的影响,进一步就可以得到是受到影响的是哪些SNP,最终即可得到受到影响的是哪些gene。
「陈有朴」原文链接:https://blog.csdn.net/qq524730309/article/details/123489362
2、当然,对Fst的计算结果可视化,当然也是非常重要的一部分,
fst图的一些可视化图
![](https://img.haomeiwen.com/i27405822/2f7b63cbf34b294b.png)
引自群体遗传进化必备小知识 (qq.com)
![](https://img.haomeiwen.com/i27405822/1befcf0a210b5ed6.png)
Fst的计算原理与实战_hs6605015的博客-CSDN博客_fst计算