【3】肿瘤基因组数据分析方法概述
2020-08-23 本文已影响0人
生物信息与育种
肿瘤基因组分析
-
肿瘤进化过程
image.png - 基本概念:germline/somatic/driver/passenger mutation
- 二次打击学说:生殖突变+体细胞突变
- 主要基于体细胞突变研究
- 发展趋势:小样本WES——大样本多组学;液体活检,免疫疗法,人工智能,微生物
肿瘤标准分析
-
肿瘤研究整体流程
image.png - 测序策略:WGS,WES,WXS(目标区域捕获)
- 突变类型:点突变,Indel(<50bp),CNV(增加/缺失),SV,病毒插入整合
- 原癌基因和抑癌基因的不同突变模式:oncogene(功能性/激活性突变,热点突变),tumor suppressor gene(截短型/失活型突变,突变分散)
-
成对分析模式
标准分析流程 - 不同突变分析工具在体细胞突变差异较大,
从多款软件中取2个以上检出位点,降低假阳性 - 主流软件:BWA MEM+GATK Haplotypecaller
- Rawdata——cleandata:SOAPnuke(去接头,低质量>50%base,N>10%),看cleanbases数据量及比例,Q20,Q30,GC%
-
cleandata——bam:
image.png
去重PCR,碱基质量重校正BQSR消除上下文(上下游各1bp)环境对碱基质量影响。
看重复率,平均测序深度,覆盖度,4X/10X/20X reads的覆盖度 - 变异检测软件:SNV(muTect,mutect2),TCGA MC3 计划(7款)
- CNV(FACETS):5种检测算法(read count数目,paired-end,split reads,assembly, combinatorial approach),主流read count算法(非重复滑动窗口统计覆盖到窗口的reads),FACETS适用WES/WGS;CODEX2软件可检测体细胞和生殖细胞CNV
- SV检测软件:BreakDancer,FermiKit,laSV,MindTheGap
Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing -
注释软件:
image.png
annovar不能商用,snpEff较流行
集成注释软件Oncotator(基因组,蛋白质,肿瘤和非肿瘤的相关注释) -
注释结果:含4方面内容
image.png
高级分析
-
主要分析
超突变样品检测
显著突变基因
新抗原预测
局部拷贝数变异
病毒整合分析
生殖系突变过滤
突变特征分析
SV突变特征分析
突变链不对称分析
突变网络分析
肿瘤分子分型
肿瘤克隆进化与异质性分析
药靶数据库注释
TCGA数据库分析 -
四大模块:
image.png
肿瘤数据库
- TCGA,COSMIC
- BGI-PETA 泛肿瘤跨组学百科全学
肿瘤基因组临床应用专题:
【1】 肿瘤医学研究前言进展
【2】肿瘤基因检测相关技术原理
【3】肿瘤基因组数据分析方法概述
【4】肿瘤转录组测序分析流程及相关软件
【5】肿瘤DNA甲基化数据分析原理及流程
【6】肿瘤胚系突变遗传分析及数据库使用
【7】基于NGS检测体系变异解读和数据库介绍
【8】肿瘤临床遗传咨询及案例分析