【基因组学】使用IGV可视化查看基因组重测序比对结果
写在前面
IGV能够将基因组的变异情况可视化,因此广泛应用于基因组学的研究中。
下面我以windows下的IGV为例,介绍一下IGV在查看基因组变异方面的应用。
一.下载
下载链接如下:https://software.broadinstitute.org/software/igv/download
和一般的软件下载情况类似,不同的是,需要在电脑上安装JAVA,这个应该难不倒各位看官老爷,因此不再赘述。
二.用户使用手册
官网的使用手册包含以下18个方面,我主要关注的是 Viewing Data和Viewing Alignments。
- User Interface
- Navigating the View
- Loading a Genome
- External Control of IGV
- Viewing the Reference Genome
- Loading Data and Attributes
- Viewing Data
- Viewing Alignments
- Viewing Variants
- Multi-Locus View
- Regions of Interest
- Sample Attributes
- Sorting, Grouping, and Filtering
- Saving and Restoring Sessions
- Server Configuration
- Motif Finder
- igvtools
- BLAT search
1. Viewing Data
1.1 Default Display
IGV的一条track代表一个样本或试验,每条track,IGV都会展示track identifier,一个或多个属性,和track数据,如图所示。
image.png
当导入文件时,IGV会根据文件的后缀名自动识别文件。如下图所示。
image.png
1.2 Changing the Display
1.3 Segmented Data
1.4 GWAS Data
IGV可以像曼哈顿图那样展示GWAS数据。
1.5 RNA Secondary Structure
2. Viewing Alignments
看的最多的比对文件就是下机数据比对到基因组的sam/bam文件。
导入IGV的bam要附带着它的索引文件,这个可以由samtools
生成。
Tracks
当你导入bam文件时,IGV会自动搜索该路径下的索引文件。
导入bam文件后,会生成3个相关的tracks。
- Alignment Track(看单条比对reads)
- Coverage Track(看测序覆盖的深度)
- Splice Junction Track(提供跨越剪接连接的读取的另一种视角)
默认情况下展示Alignment Track
和Coverage Track
。
Coverage Track
如果一个核苷酸与参考序列的差异大于20%的加权质量reads, IGV会根据每个碱基的reads数的比例赋予染色。
- 通过右键单击跟踪并选择设置等位基因频率阈值来覆盖单个覆盖track的默认阈值。
-
要更改所有覆盖轨迹的默认值,请在视图> Preferences下的Alignments选项卡中设置覆盖等位基因-分数阈值。
将鼠标悬停在覆盖栏上查看计数细节。从右键菜单中复制计数细节到计算机的剪贴板。
image.png
Alignment Track
默认情况下,匹配参考基因组的碱基展示为灰色。碱基的插入用紫色表示,碱基的删除用黑色横线表示。
-
Transparency for Mapped Reads
注意,如屏幕截图所示,以浅灰色边框和透明或白色填充显示的对齐,其映射质量为零。
在这种情况下,reads也映射到另一个同样好的位置。
也有可能reads不能被唯一地放置,但其他的放置不一定能带来同样高质量的得分。
image.png -
Insertions
IGV用紫色或红色表示碱基的插入,鼠标悬浮能够看到该碱基的详细信息。
image.png -
Deletions
image.png
在有gap的reads中,IGV用黑色短线表示相对于参考基因组的删除。
Paired-End Alignments -
View As Pairs
默认情况下,IGV显示单独的reads,因为它们紧密地打包在一起。
从右键菜单中选择View as pairs,以如下图所示的方式显示连接两端的成对。鼠标悬停(2)也会显示在普通视图(左)的单个reads或成对读取视图(右)的成对reads。
image.png
2.1 Interpreting Color by Insert Size
IGV使用不同的颜色来标志异常的插入。当你在弹出菜单中通过插入大小选择颜色对齐>
时,默认的着色方案是:
-
Deletions
单端的缺失。
image.png
双端的缺失。
image.png
在IGV中展示的结果。
image.png -
Insertions
单端示意图。
image.png
双端示意图。
image.png
检测到异常插入大小受片段大小的限制。读长必须足够长,以跨越插入位置,并包含两端映射到参考基因组的序列,能检测到的最大插入大小为:fragment length - (2x read length)。
IGV示意图。
image.png
-
Inter-chromosomal Rearrangement
下面这个例子中,reads一端在染色体1上,另一端在染色体6上。
image.png
2.2 Interpreting Color by Pair Orientation
成对reads的方向可用于检测结构变异事件,包括染色体倒置,复制和易位。
绿色、蓝绿色和深蓝色的阴影表示倒置、复制和易位的结构事件;不同的颜色取决于不同的平台。
image.png
Inversions
染色体上的倒置。
双末端测序揭示的倒置。
image.png
在IGV上展示如下。
image.png
Inverted Duplication
当一大段DNA被复制并以与原始序列相反的构型插入基因组时,这被称为反向复制。
image.png
这将会有重叠的左边和右边的reads,并且有可能由覆盖深度/拷贝数所决定。
image.png
在IGV中展示如下。
image.png
Tandem Duplication
当一大段DNA被复制并插入到基因组中原始序列的旁边时,这被称为串联复制。
IGV展示如下。
image.png
Translocation on the Same Chromosome
当一大段DNA从一个位置移除并插入到其他位置时,这就是易位。
image.png
同一染色体上的易位可通过对取向的颜色编码检测,而两个染色体之间的易位可通过插入大小的染色检测。
image.png
2.3 Interpreting Color by Bisulfite Mode
2.4 Splice Junctions
2.5 Sashimi Plot
未完待续~
参考链接:
http://software.broadinstitute.org/software/igv/UserGuide