TBtools使用

SAM / BAM / VCF | 全局概览 | BINning

2022-02-12  本文已影响0人  生信石头

写在前面

Emmm,前两日,在 TBtools 主程序中,简单推了一下新的小功能,见《小工具 | 滑窗计算GCskew / GCratio / Nratio》,可用于全局查看基因组组装结果中 gap 的分布,GC的偏向性或者碱基比例变化。后台也看到一些信息,即一般我们不仅仅关注序列本身,我们更多会关注:

  1. 测序覆盖率变化
  2. 变异发生频率变化

这两类数据,一般以 SAM/BAM/CRAM 和 VCF 格式存储。进行具体分布频率查看,感觉应是有用。顺手写了一下....(PS: 也意味着「TBtools」一只脚踏入高通量测序数据文件处理范围 - ....我还是妥协了,开始用 htsjdk....)。
PS: 对这两个功能感兴趣的朋友,需要将「TBtools」升级到 v1.0986987 或更高版本。

功能简介

两类文件处理方式有区别,尽管逻辑一致,于是做成两个功能,功能位置如下(事实上,我们可以从 TBtools 界面右上角直接搜索并跳转功能):



具体功能界面如下




注意到,读段回帖文件和VCF文件的默认 Count Mode 不同...主要考量是读段有的确实跨度长如Pacbio读段;而VCF目前主要还是记录snp和small indel.... 有需要的可自行调整。

大体结果展示

综合了 Gene Density Profile,Fasta Window Stat,SAM/BAM/CRAM BIN Cov 和 VCF BIN Cov 的结果....



注意到,要绘制这样一个图,宏观探索自己的数据。在 TBtools 里面,用户只需要:

  1. 基因组序列文件
  2. 读段回帖的 SAM/BAM/CRAM 文件(常规流程可得)
  3. VCF文件(常规流程可得)

每一个文件可以简单用 TBtools 的对应功能整理...然后直接用于 Advanced Circos 可视化

写在最后

很多时候,我们走着走着,或许就忘了为啥出发....
Advanced Circos 做了确实不少更新,整体速度全面提升....

上一篇 下一篇

猜你喜欢

热点阅读