相关性及PCA分析

2020-11-27  本文已影响0人  斩毛毛

简要介绍相关性及PCA分析

1、 相关性分析

本次使用数据如下所示:


data <- read.table('quality.txt',header = T,sep = "\t",row.names = 'Samples')
library(corrplot)
corrplot::corrplot(cor(data),type = 'upper',
                        addCoef.col = 'black')

## 参数:
type:  上半部分
a ddCoef.col: 添加相似值的颜色

结果如下


2、PCA分析

还是用上述数据

library(ggfortify)
library(cluster)
autoplot(object = prcomp(data), data = data)
#参数解析
# autoplot函数是ggplot包所属的一个函数。可以实现基于特殊对象实现快速绘图。
# object指定绘图对象
# data指定绘图数据集
# prcomp函数基于给定数据集进行PCA分析
# cleandata为进行分析的数据集
autoplot(object = pam(data, 2), frame = TRUE, frame.type = 'norm')
#参数解析
# pam函数功能类似prcomp函数,区别在于它会将PCA的结果进行K-means聚类分析,在 
# 函数的参数中,cleandata为数据集,3为K-means聚类的K值,简单理解就是设置最终聚成几类。
# frame是一个逻辑值,设置是否在聚成一类的数据点周围添加外框来突出展示。
# frame.type设置添加的外框类型,norm代表添加椭圆,默认为多边形
#添加图片标题
autoplot(object = pam(data, 2), frame = TRUE, frame.type = 'norm') +
labs(title="PCA Analysis") + 
  
  #图片标题居中,设置字体大小为20
  theme(plot.title = element_text(hjust = 0.5 ,size = 20),
        
        #删除图例标题
        legend.title = element_blank()) +
  
  #手动指定图列的颜色与名称 
  scale_fill_manual(values = c('red','blue'),labels = c('A','B')) +
  scale_color_manual(values = c('red','blue'),labels = c('A','B'))

** 以上PCA分析内容来自 R语言绘图-PCA图形优化 **

上一篇下一篇

猜你喜欢

热点阅读