MrBayes使用2021-07-30
使用MrBayes需要配置Nexus 文件
参考
https://bin-ye.com/post/2019/10/19/%E5%A5%BD%E5%A5%BD%E5%85%88%E7%94%9F-mrbayes-%E6%93%8D%E4%BD%9C%E8%AF%B4%E6%98%8E/
https://www.jianshu.com/p/8b10ef5c26e1
#NEXUS
BEGIN DATA;
dimensions ntax=37 nchar=2087;
format missing=?
datatype=PROTEIN gap= -;
matrix
Brachionus_calyciflorus_KX822781 ISLILINLAGNITLFYSQTLISLMFWV-PILA
Brachionus_plicatilis_NC_010484 ????????????????????????????????
Brachionus_rubens_MN256532 ????????????????????????????????
Brentisentis_yangtzensis_MK651258 SILIVLNLSSLVSMMYGLVGFGFSVWFWGVTA
Cavisoma_magnum_MN562586_1 -------------MGFGLVLLGFWMWAWSVIS
Centrorhynchus_aluconis_NC_029765 NLIGVDNLVGLISVGYGMVLVGMMMWSWGECG
Centrorhynchus_clitorideus_MT113355 GLVVLDNLSGLFSMGYGLVMLSTSLWTWSEYA
Centrorhynchus_milvus_MK922344 SCIVLDNLAGLFSVGYGVVLFGVSLWAWGECS
........
;
END;
begin mrbayes;
charset Subset1 = 1-107;
charset Subset2 = 108-566;
charset Subset3 = 567-731;
charset Subset4 = 732-870;
charset Subset5 = 871-1182;
charset Subset6 = 1183-1382;
charset Subset7 = 1383-1523;
charset Subset8 = 1524-1574;
charset Subset9 = 1575-1599;
charset Subset10 = 1600-1818;
charset Subset11 = 1819-2055;
charset Subset12 = 2056-2087;
partition PartitionFinder = 12:Subset1, Subset2, Subset3, Subset4, Subset5, Subset6, Subset7, Subset8, Subset9, Subset10, Subset11, Subset12;
set partition=PartitionFinder;
lset applyto=(1) rates=invgamma;
prset applyto=(1) aamodelpr=fixed(wag);
lset applyto=(2) rates=invgamma;
prset applyto=(2) aamodelpr=fixed(wag);
lset applyto=(3) rates=invgamma;
prset applyto=(3) aamodelpr=fixed(wag);
lset applyto=(4) rates=invgamma;
prset applyto=(4) aamodelpr=fixed(wag);
lset applyto=(5) rates=invgamma;
prset applyto=(5) aamodelpr=fixed(wag);
lset applyto=(6) rates=gamma;
prset applyto=(6) aamodelpr=fixed(wag);
lset applyto=(7) rates=invgamma;
prset applyto=(7) aamodelpr=fixed(wag);
lset applyto=(8) rates=gamma;
prset applyto=(8) aamodelpr=fixed(mtrev);
lset applyto=(9) rates=gamma;
prset applyto=(9) aamodelpr=fixed(wag);
lset applyto=(10) rates=invgamma;
prset applyto=(10) aamodelpr=fixed(wag);
lset applyto=(11) rates=invgamma;
prset applyto=(11) aamodelpr=fixed(wag);
lset applyto=(12) rates=gamma;
prset applyto=(12) aamodelpr=fixed(cprev);
prset applyto=(all) ratepr=variable;
unlink statefreq=(all) revmat=(all) shape=(all) pinvar=(all) tratio=(all);
unlink brlens=(all);
mcmcp ngen=5000000 printfreq=1000 samplefreq=100 nchains=4 nruns=2 savebrlens=yes checkpoint=yes checkfreq=5000;
mcmc;
sumt conformat=Simple contype=Halfcompat relburnin=yes burninfrac=0.25;
sump relburnin=yes burninfrac=0.25;
end;
我将Nexus 文件分为三部分方便处理。
第一部分是矩阵信息:
矩阵信息这可直接使用PhyloSuite(http://phylosuite.jushengwu.com/)生成的nex文件
BEGIN DATA;
dimensions ntax=37 nchar=2087;
format missing=?
datatype=PROTEIN gap= -;
matrix
.....
END;
第二部分是分区以及模型信息:
具体解释可以看参考的链接以及官方文档。
分区以及模型设置,直接使用PartitionFinder2生成结果复制
./analysis/schemes/start_scheme.txt
#该文件为结果信息
复制MrBayes 部分的内容
MrBayes block for partition definitions
.........
begin mrbayes;
.........
end;
第三部分是分析运行设置:
mcmcp ngen=5000000 printfreq=1000 samplefreq=100 nchains=4 nruns=2 savebrlens=yes checkpoint=yes checkfreq=5000;
mcmc;
sumt conformat=Simple contype=Halfcompat relburnin=yes burninfrac=0.25;
sump relburnin=yes burninfrac=0.25;
#查看MrBayes参数
mb
help
#查看帮助
help mcmcp
#查看制定命令的信息帮助
代数相关设置:
-
mcmcp用于设置链参数。
-
mcmc开始马尔科夫链
-
Ngen运行分析的代数
-
Samplefreq确定链的采样频率;默认值每500代一次。
-
Printfreq控制有关项目的简要信息打印到屏幕上的频率。默认1000
-
Nruns=2,设置马尔科夫链的数量
- Nchains,默认是4
Nchains=1时没有“加热”链,当Nchains设置为大于1的值n时,则n−1条链是“加热”链。较大和困难的数据集建议3条以上“加热”链。
-
Relburnin 确定是固定舍弃(relburnin=no)还是使用舍弃百分比(relburnin=yes)。
-
sump统计取样参数,会生成一个表统计样本模型参数信息
-
sumt统计树取样
会生成一个分支图(系统发育关系推断的树图)
conformat=simple生成一个简单的合意树可以被大多数软件解读。simple会生成两个树一个包含枝长和支持度,另一个只有枝长。
conformat=figtree则是只剩一个包含枝长和支持度的树,更适合figtree