R | ggmsa: 多序列比对的可视化
参考:
ggmsa: a visual exploration tool for multiple sequence alignment and associated data
https://github.com/YuLab-SMU/ggmsa
http://yulab-smu.top/ggmsa/ (需梯子)
公众号 | YuLabSMU | 文章发表:ggmsa - 多序列比对和相关数据的可视化探索工具
公众号 | YuLabSMU | 从彩虹图到序列之眼
主要用途就是多序列比对可视化,还不太了解展示RNA二级结构的序列之眼,以及其依赖文件,没做过相应分析。
geom_seqlogo()
和geom_msaBar()
一起使用时,多序列比对中的文字会受到挤压?
# 下载 R 包
if (!requireNamespace("devtools", quietly=TRUE))
install.packages("devtools")
devtools::install_github("YuLab-SMU/ggmsa")
# 加载 R 包
library(ggmsa)
# 导入实例数据,多序列比对 fa 文件
protein_sequences <- system.file("extdata", "sample.fasta", package = "ggmsa")
protein_sequences
#> [1] "D:/2_software/5_R/R-4.1.1/library/ggmsa/extdata/sample.fasta"
pdf("a.pdf")
ggmsa(protein_sequences, start = 221, end = 280, char_width = 0.5, seq_name = TRUE) +
geom_seqlogo() +
geom_msaBar()
dev.off()
1. Annotation | 注释
具体:http://yulab-smu.top/ggmsa/articles/guides/Annotations.html
其实不止以下几种,所有函数请看:http://yulab-smu.top/ggmsa/reference/index.html,比如 DNA序列重组可视化方法 中用到的
seqdiff()
。
-
geom_seqlogo()
: 多序列比对可视化 -
geom_GC()
: 用气泡图显示 GC 含量 -
geom_seed()
: 突出 miRNA 序列上的 seed 区 -
geom_msaBar()
: 用条形图显示序列保守性 -
geom_helix()
: 用圆弧图表示RNA二级结构(需要额外数据),但我不了解这方面。
2. Color Schemes and Font Families | 配色和字体
具体:http://yulab-smu.top/ggmsa/articles/guides/Color_schemes_And_Font_Families.html
color = "Chemistry_AA"
: 配色,默认根据侧链化学成分
font = "TimesNewRoman"
: 字体
available_colors()
#> 1.color schemes for nucleotide sequences currently available:
#> Chemistry_NT Shapely_NT Taylor_NT Zappo_NT
#>
#> 2.color schemes for AA sequences currently available:
#> ClustalChemistry_AA Shapely_AA Zappo_AA Taylor_AA LETTER CN6 Hydrophobicity
#>
available_fonts()
#> font families currently available:
#> helvetical mono TimesNewRoman DroidSansMono
#>
3. Theme | 主题
具体:http://yulab-smu.top/ggmsa/articles/guides/MSA_theme.html
char_width
: 字符宽度,默认 0.9
none_bg = TRUE
: 仅显示字符,去除有色背景
seq_name = TRUE
: 显示序列名称
show.legend = TRUE
: 显示多序列比对图的图例
border = NA
: 去除描边;border = "white"
: 白色描边
poHighlighted = c(185, 190)
: 特定位置高亮
4. Other Modules | 其他模块
具体:http://yulab-smu.top/ggmsa/articles/guides/Other_Modules.html
-
seqlogo()
: 相当于只显示geom_seqlogo()
的上半部分 -
ggSeqBundle()
: 序列束 -
gghelix()
: 相当于只显示geom_helix()
的上半部分
5. View Modes | 视图模式
具体:http://yulab-smu.top/ggmsa/articles/guides/View_modes.html
-
consensus_views = TRUE
: 根据序列一致性
disagreement = TRUE,use_dot = TRUE
: 将一致性位点用·
代替,注意搭配两个逻辑值。
ignore_gaps = TRUE
ref
: 字符串,指定参考序列 -
by_conservation = TRUE
: 根据序列保守性 配色,越保守颜色越深。