群体遗传学GWAS

【群体结构】CLUMPP软件使用

2021-02-21  本文已影响0人  群体遗传学

最近在做群体结构分析,群体结构三剑客:structure、pac和kinship。这边我主要用的软件是structure,毕竟比较老牌,正常一个K值只要1天时间,我感觉还能接受。在structure获得输出结果后,需要利用CLUMPP对多次循环的K矩阵进行合并。

CLUMPP的安装

官网网址:https://web.stanford.edu/group/rosenberglab/clumpp.html,进行简单的一个注册之后,就可以跳转到下载链接。
下载与安装

wget https://web.stanford.edu/group/rosenberglab/software/CLUMPP_Linux64.1.1.2.tar.gz
tar zxvf CLUMPP_Linux64.1.1.2.tar.gz #解压即可用

CLUMPP的使用

  1. 对structure的循环结果进行提取,构建成CLUMPP的输入文件格式。

下面为我提取structure的结果的一个脚本,我设置的循环数为5,分别从0-4,结果文件分别为structure.out.3.0_fstructure.out.3.1_fstructure.out.3.2_fstructure.out.3.3_fstructure.out.3.4_f

my(@line,$flag,$num,$i);
open OUT, ">241map.popfile";    #文件输出名
for($i=0;$i<=4;$i++){
        $flag=0;
        $num=1;
        open IN, "structure.out.3.".$i."_f";    # 只针对K=3
        while(<IN>){
                chomp;
                if(/^Inferred ancestry/){
                        $flag=1;
                }
                if($flag==1){
                        @line=split/\s+/;

                        if(scalar(@line)==8){
                             print OUT $num.": ".$line[5]." ".$line[6]." ".$line[7]." 1\n";
                        }elsif(scalar(@line)==7){
                                print OUT $num.": ".$line[4]." ".$line[5]." ".$line[6]." 1\n";
                        }
                }

                if(/Estimated Allele Frequencies in each cluster/){
                        $flag=0;
                }
                $num++;
        }
        print OUT "\n";
}
  1. CLUMPP参数文件设置
  1. 直接在当前目录运行即可
~/software/CLUMPP_Linux64.1.1.2/CLUMPP

结果文件与输入文件类似,均为5列,直接提取中间3列数值去R语言绘图即可。


在这里插入图片描述
上一篇 下一篇

猜你喜欢

热点阅读