CNGBdb发布在线基因型插补平台【CNGB Imputatio
2023年10月23日,国家基因库生命大数据平台支撑科研成果在《Nucleic Acids Research》发表。该研究题为“A high-resolution haplotype-resolved Reference panel constructed from the China Kadoorie Biobank Study”,依托中国慢性病前瞻性研究队列(CKB)的高质量样本与自主可控的DNBSEQ国产测序平台完成,成功绘制了高精度中国人群单倍型参考序列组,并依托深圳国家基因库部署了在线基因型插补平台——CNGB Imputation Service,为广大科研工作者提供免费服务,为东亚人群复杂表型遗传机制的研究提供了宝贵资源。

本研究的相关数据已存储于国家基因库生命大数据平台(CNGBdb),项目编号为:CNP0003405;在线基因型插补平台——CNGB Imputation Service已在国家基因库生命大数据平台(CNGBdb)上线。
高精度单倍型参考序列是精细群体遗传结构解析的基础,也是进行全基因组关联研究(Genome-wide association study, GWAS)的重要数据基础。

构建高精度单倍型参考序列集
在本课题中,研究团队使用了取自中国慢性病前瞻性研究队列(China Kadoorie Biobank,CKB)的1万例中等深度(15x)全基因组测序数据,结合精细的分析、质控与高效率的算法,构建了高精度单倍型参考序列集(CKB panel),并从变异数目、插补准确性等各个方面全面评估了CKB panel和已发表参考序列集的表现。结果显示CKB panel保留了更多高质量变异位点且具有较高的插补准确性,表现优异。

此外,研究团队还基于CKB panel,对十万例已完成测定的CKB基因芯片数据进行了高质量的基因型插补。结果显示,插补后可用于全基因组关联分析的变异位点总数增加了2倍,由约300万增加至920万;同时,鉴定出的与身高显著关联的基因座数目从119个增加到147个。在新发现的28个位点中,有26个先前已在欧洲人群中被报道与身高相关,显示了使用CKB panel插补后,芯片数据的质量和价值显著提升。

部署在线基因型插补平台CNGB Imputation Service
依托深圳国家基因库,科研团队基于CKB panel开发了一个在线服务平台——CNGB Imputation Service。目前,CNGB Imputation Service已在国家基因库生命大数据平台(CNGBdb)上线。

CKB panel是基于中国人群构建的高质量单倍型参考序列集,对于提升芯片或低深度测序数据的质量和价值具有重要意义,将为东亚人群复杂表型和疾病的研究提供重要的支撑与数据基础。CNGB Imputation Service在隔离关键数据,充分保障数据安全的前提下,为科研人员提供基于CKB panel的免费基因型插补服务,只需要三步即可快速完成基因型插补分析。CNGB Imputation Service性能测评结果显示其插补准确率高达96%以上。
参考文献:
Yu C, Lan X, Tao Y, et al. A high-resolution haplotype-resolved Reference panel constructed from the China Kadoorie Biobank Study. Nucleic Acids Res. 2023 Oct 23:gkad779. doi: 10.1093/nar/gkad779. Epub ahead of print. PMID: 37870428.
信息及图片来源:“北京大学公众健康战略研究中心”公众号。