微生物研究

技术升级 | 宏基因组HiFi reads获取高质量完成图

2022-02-24  本文已影响0人  ee00dc6faab7

宏基因组学是研究微生物群落的常用方法之一。三代HiFi测序的出现,克服了以往宏基因组学NGS测序的短读长、准确性低的缺点,成为微生态研究领域的“新宠儿”。由于HiFi测序本身携带的种种优势,决定了它在宏基因组组装方面将会取得非凡的成绩,因此,出现了与之更加契合的组装软件来实现更高组装的水平。

2021年10月,哈佛大学医学院Dana-Farber癌症研究所李恒课题组重磅推出三代HiFi宏基因组组装软件——hifiasm-meta。研究论文“Metagenome assembly of high-fidelity long reads with hifiasm-meta”预印本在线发布。作者使用模拟菌群和实测样本,评估了hifiasm-meta软件组装效果,对比了HiCanu、metaFlye、MetaBAT2软件的结果和性能,发现使用hifiasm-meta软件可以得到更多的环状MAGs,性能上也略胜一筹。将肠道内容物样本进行宏基因组HiFi测序,使用hifiasm-meta和metaFlye两款软件进行组装比较,让我们来一探究竟吧!

数据质控

对4个肠道内容物样本进行HiFi宏基因组测序,得到23Gbp左右数据量,N50 read长度为20Kbp左右,质控结果如表1所示:

表1 HiFi宏基因组测序质控结果

组装结果

质控后的数据分别使用hifiasm-meta 和metaFlye软件进行组装,过滤500bp以下的contigs,如表2所示,结果发现使用hifiasm-meta软件组装的4个样本的总长度和平均长度均长于metaFlye软件组装的结果,Contig N50 长度相比变短,GC含量基本不变。

表2 hifiasm-meta和metaFlye软件组装结果

图1和图2分别为样本组装后contig总长度和平均长度的比对折线图,从图中可以更加明显的看出,使用hifiasm-meta软件进行样本组装,组装水平得以显著提高,contig总长度至少提高50%,其中gut3增加了2.7倍!大大增加获得更完整基因组序列的可能性!

使用CheckM检测组装完整性和污染度,定义“近完成图(near-complete)“为完整性≥90%,污染度≤5%的contigs,“high-quality”为完整性≥70%,污染度≤10%的contigs。下表3为contig长度大于1M的检测结果,我们发现hifiasm-meta软件组装的contigs数量、近完成图和high-quality的数量均显著多于metaFlye的组装。其中,gut1样本中,hifiasm-meta重建了124个长度>1Mb的contigs,有14个近完成图,其中2个是环状contigs。

表3 CheckM 检测结果

ORF预测

将两种软件的组装结果分别进行ORF预测,如下表4。结果显示,使用hifiasm-meta软件组装得到的ORF数量和ORF总长度比metaFlye均有所提高,ORF完整性相比也略有提升!

表4 ORF预测结果

注:Integrity:all:包含起始密码子和终止密码子的ORF。 

软件性能

对hifiasm-meta和metaFlye软件进行性能统计,发现使用hifiasm-meta软件组装肠道内容物,需要32个CPU,大概30个小时左右,与metaFlye所需时间相当。

总体而言,hifiasm-meta相比metaFlye 软件可以获得更多更完整的基因组,从而提高注释准确度和分辨率,挖掘更深层次功能等。

HiFi宏基因组测序相比传统测序的优势如下:

测序:长度长、准确度高,无GC偏好性,可跨越长复杂区域

组装:无需二代矫正,大幅提升组装完整性和连续性,可达完成图水平

应用:人体微生态领域(代谢类疾病、消化道疾病、免疫力疾病、肝病、癌症等);动物营养、免疫及治疗领域;土壤、活性污泥、废水等环境领域;根际微生物等植物领域 

PS:

预印论文参见:

https://arxiv.org/pdf/2110.08457.pdf

代码和使用说明等参见:

https://github.com/xfengnefx/hifiasm-meta

上一篇 下一篇

猜你喜欢

热点阅读