Sentieon软件介绍

2020-10-07  本文已影响0人  chSNP

下载Sentieon软件
公司成立于2014年7月,总部位于美国硅谷的山景城(Mountain View)。团队成员具有多年的信号处理,大规模数据挖掘,和高性能计算的经验。Sentieon为来自于分子诊断,药物研发,临床医疗等多个领域的合作伙伴和科研机构提供软件解决方案,共同推动基因技术的发展,实现“成就精准数据,服务精准医疗“的愿景。
2017年,Sentieon Inc授权毅硕科技(Insvast)作为中国区服务机构,深度支撑本地区精准医疗、生物信息领域的发展。

业内痛点

    目前,针对二代测序数据的二次分析(SNP/ Indel 变异检测),BWA+GATK 最佳实践流程,经过十多年大量样本的反复验证,得到了业界的广泛认可,是公认的金标准。
   但是,BWA + GATK 流程也有几个显著的问题。第一,流程运行时间长,资源利用率低,计算成本高。第二,GATK在高测序深度区域的随机降采样,会影响变异检测的灵敏度和准确度,尤其是肿瘤的低丰度(VAF)变异,同时造成重复运行时结果的不一致性。

Sentieon解决方案

    Sentieon推出了从比对到变异检测的完整的二次分析的纯软件解决方案,可用于胚系突变检测和体细胞突变检测。Sentieon软件忠实地实现了BWA/GATK/MuTect/MuTect2金标准的数学模型,在保证结果完全匹配金标准的前提下,软件运行效率提升10倍以上。
image.png

获奖情况

Sentieon 2015年正式推出软件产品以来,多次赢得国际生信大赛的第一名或并列第一名。

· 2016 PrecisionFDA Truth Challenge
· 2016 PrecisionFDA Consistency Challenge
· 2016 ICGC-TCGA-DREAM Somatic Mutation Calling Challenge
· 2017 PrecisionFDA Hidden Treasures - Warm Up
· 2018 PrecisionFDA NCI-CPTAC Multi-omics Enabled Sample Mislabeling Correction Challenge, both subchallenge1 and subchallenge2
· 2019 Bio-IT Innovative Practices Awards
· 2019 Sentieon在precisionFDA多组学数据挑战赛夺冠

0F736B3D-9A5D-4E89-AAC3-F1CC6147FC0F.png

业界认可

Sentieon软件已被上百家公司和科研机构广泛认证和使用,包括:
· 全世界多家大型跨国制药公司,测序服务提供商,分子诊断公司。
· 医院和医疗研究机构,包括由美国15家大型医院和药厂牵头的Orien 项目
· 政府机构:包括美国药监局,国家卫生局,国家癌症研究所等。
· 学校和科研机构:包括美国哈佛、耶鲁、斯坦福、康奈尔,中国中科院、协 和医学院、复旦大学、上海交大、中山大学等。

   迄今为止,Sentieon软件已经运行处理超过40 PB的数据量,上百万样本,共计超过1亿核时,并在包括NEJM,Cell,Nature等世界一级影响因子的刊物上被多次引用。

功能亮点
纯软方案:可高效、灵活部署在不同计算环境上。无需特殊硬件,降低运营维护成本。

17E8F948-4EAC-4E75-8593-A1DE4ABAB2A2.png

适用场景
作为业界标准的BWA/GATK/Mutect2流程的加速替换,Sentieon软件业同样适用于跨基础科研,转化医学,临床等多个领域的各个研究和应用方向。以下列出部分适用场景。

35A5E55D-2C94-458F-BFBC-AED80D9463E8.png

功能模块
Sentieon软件的使用非常灵活。用户可以直接使用完整流程,也可以根据具体需要单独调用相关模块去替换原流程中的模块。Sentieon模块的输入输出文件都尽量符合业界使用习惯,降低使用难度。下表中就是目前Sentieon可以提供给客户使用的模块以及具体功能。

8F44A5BB-2637-48E0-8454-45D814CBC55D.png

AI算法的应用
2019年5月4~8日,国际计算生物学会在乔治华盛顿大学举办了RECOMB 2019年会。在今年的RECOMB Dream卫星会上,美国FDA和NCI宣布了PrecisionFDA NCI-CPTAC Multi-omics Enabled Sample Mislabeling Correction Challenge(多组学数据分析和样本标签校正挑战赛)的结果,Sentieon获得了满分
随着包括NGS在内的组学检测工具的飞速发展,在同一个体上获取基因组、转录组、蛋白组、甲基组、表型组等多组学大数据已经渐渐成为现实。多组学数据的价值在于能精确地将数据中的信息完整提炼成能够反映复杂分子相互作用的模型。这样的模型可以极大的深化研究人员对于疾病机理的理解,继而应用在临床实践上,例如通过病人基因组和蛋白组的数据预测肿瘤的临床预后。
当前,多组学的联合分析还处于较为初期阶段,对于微弱信号的挖掘能力还较弱。机器学习作为复杂数据分析的有力工具,正被逐步应用。然而,面对当前有限的训练数据集,如何实现在高维度多组学数据的精准建模仍是一个重要课题。这也是本次挑战赛的核心目的。
本次挑战赛的目标是根据多组学数据鉴定出测试集样本中人的错误标记(mislabeling),具体分为两个阶段:

    在本次分析挑战赛数据的过程中,Sentieon团队开发并使用了多种机器学习模型,在背景噪音中精准提取出不同组学数据之间的微弱但确定的关联。
    众所周知,相比于在生物影像识别和非生物数据领域的快速应用,AI的应用在组学数据,尤其是基因组数据分析领域,一直受限于可用真集数目。目前只有不超过10个公认的胚系变异真集。而体细胞变异真集需要各个机构通过稀释和人工复核的方式自行维护,因此构建成本高,数据量也非常有限,而临床数据的训练集更是需要长时间和更高的成本来追踪和维护。
   Sentieon在这次挑战赛中展现了优秀的AI算法开发和实践的能力,在非常小的样本集上,实现了高维数据的建模,这一点在生物医学多组学模型建立中尤为重要。
   目前这套优秀的机器学习算法正在被应用在Sentieon的二次分析软件DNAscope(胚系变异)和TNscope(体细胞变异)中。这套分析方法,一方面保持了DNAseq和TNseq基础算法的稳定性和准确性,另一方面又可以根据用户提供的样本数据作为训练集,针对不同的样本类型,试剂套装,测序平台建立特定模型,大幅提高特定生产环境的准确性和可靠性。我们非常愿意和广大合作伙伴开启合作模式,共同探索Sentieon组学机器学习算法在各项医疗产品上的应用。

Sentieon软件常用的链接

Q: 请问我去哪里下载Sentieon软件和手册?

A: 您可以到以下链接下载最新版的Sentieon软件和使用手册?
https://share.weiyun.com/HzAXQoGH

Q: 请问有中文的软件技术支持吗?

A 您可以登录一下网站了解Sentieon软件的中文支持:
https://www.insvast.com/sentieon

Q: 请问Sentieon的模块和GATK模块有哪些版本对应:

A: 关于这个问题,您可以访问Sentieon的对应GATK的说明:
https://support.sentieon.com/appnotes/arguments

Q: 使用Sentieon软件进行NGS分析时,有推荐的pipeline脚本吗?

A: 您可以访问GitHub上由Sentieon官方维护的示例脚本,在此提示,这些脚本参数仅作为参考,具体样本类型和分析情况要咨询技术支持人员:
https://github.com/Sentieon/sentieon-scripts/tree/master/example_pipelines

上一篇下一篇

猜你喜欢

热点阅读