生物信息学

文献笔记五十六:新型冠状病毒的进化分析2

2020-02-04  本文已影响0人  小明的数据分析笔记本
论文题目

Evolution of the novel coronavirus from the ongoing Wuhan outbreak and modeling of its spike protein for risk of human transmission
2020年1月21日
SCIENCE CHINA Life Sciences

研究单位
image.png
主要的研究内容

本篇笔记重点关注论文中对进化树的解释

图一A
ggtree操作进化树
library(ggtree)
tree<-read.tree("../../Novel_Coronavirus/novelvirus.treefile")
library(ggplot2)
df<-fortify(tree)
df1<-df[which(!df$isTip),]
df1$bootstrap<-ifelse(df1$label>=50,">=50","<50")
df2<-df[which(df$isTip),]
df3_1<-df2[20:25,]
df3_1
df3_2<-df2[c(1:19,26:64),]
df3_1$color<-"A"
df3_2$color<-"B"
df3<-rbind(df3_1,df3_2)
library(dplyr)
df3<-df3%>%
  select(c("label","color"))
df3
p<-ggtree(df,layout = "circular")+
  geom_point(data=df1,aes(x=x,y=y,color=bootstrap),size=5)
p
p1<-p%<+%df3+
  geom_tiplab2(aes(col=color),align=T)+
  scale_color_manual(values=c("darkgreen","skyblue","red","black"))
p1
pdf(file="nv1.pdf",height=20,width=20)
rotate_tree(p1,135)
dev.off()
image.png
过程中遇到的问题

以上两个问题暂时还不知道如何解决

文章中用到的序列数据大家可以自己下载,或者直接在我的公众号留言即可!

欢迎大家关注我的公众号
小明的数据分析笔记本

公众号二维码.jpg

希望这波疫情早日结束
中国加油!武汉加油!

上一篇下一篇

猜你喜欢

热点阅读