基因家族鉴定-顺势作用元件可视化
分析的过程可能下次会写。
我们用到一个r包
library(tidyverse)
library(RColorBrewer)
setwd("C:/")
df<- read_tsv('data.txt', col_names = F) %>% select(1,2)
#df <- df %>% arrange(X3)
#uniq_level <- df %>% distinct(X2,X3)
#df$X2 <- factor(df$X2, levels = uniq_level$X2)
tidy <- df %>%
group_by(X1, X2) %>%
summarise(number = n()) %>%
arrange(desc(number))
summary(tidy$number)
ggplot(tidy, aes(x = X2, y = X1, fill = number)) +
geom_tile(color = 'black') +
geom_text(aes(label = number),col='black',cex = 1.5) +
scale_fill_gradientn(colors = rev(hcl.colors(10, "RdYlGn"))) +
scale_x_discrete(position = "top")+
theme_bw() +
theme(axis.text.x = element_text(angle = 90, hjust = 0),
axis.title = element_blank(),
axis.text = element_text(size = 7, color = 'black'))
注意注意,10的地方改成max就行。
需要准备的文件格式,基因名 tab 元件名 tab 描述。