生信星球培训第八期

学习小组Day6笔记--🙃D

2018-10-27  本文已影响75人  忆落_angle

        生信起步第六站-R大哥的“魔法”技能。


之前一直很“怨恨”R包,主要因为各种安装可能会遇到各种麻烦,但不可否认的是,正是因为这些“麻烦”,才让我发现R大哥是个很有内涵的家伙,技能很多嘛。今天,他将变身“巴啦啦大魔哥”🧚‍♂️,打开他的一个包裹,给我们展示的就是“如何对数据施魔法”。


Tydir包裹准备

一、获得包裹

(一) 获取包裹小抄(生信星球tidyr)

(二) 安装包裹-极简安包

1 Rstudio控制台输入library(tidyr),检查是否已经安装过
2-1安装过:congratulation!
2-2没安过:键入install.packages("tidyr")自动安装,再加载tidyr看一下
(若报错,换国内镜像:Tools→Global Options→Packages→CRAN mirror→Change→China开头几个选项里,哪个近选哪个)


二、了解包裹

(一)认识Tidy Data

Tidy Data我更喜欢把它联想成R大哥变魔术的辅助动物-那只泰迪熊🐻:这个泰迪就是一个管理小队长,可以把数据归拢的齐齐刷刷💁‍♀️最简单的理解示例就好比用Excel录入原始数据,你得把它变成SPSS格式才能进行统计处理吧,tidy就是中间这个“变”的环节。

(二) 初步了解tydir功能

(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并
                                        🚩数据→数据框→数据处理+作图

(三)了解数据框

1 新建数据框(直接赋值给bioplanet)
bioplanet<-data.frame(GeneID = rep("gene1",times=4),SampleName =paste("Sample",1:4,sep=""),Expression=c(14,19,18,15))
新建数据框
2 了解含义
3 注意事项

施法

1.Reshape Data

归拢数据

首先,建立一个施法对象--数据
a<-data.frame(country=c("A","B","C"),"1999"=paste(c(0.7,37,212),"K"),"2000"=paste(c(2,80,213),"K"))
新建数据

然后,变变变💠


2.Handle Missing Values

用于处理丢失的数据(就是某些单元格有空值的情况)。 处理方式如下:
(1)删除整行
(2)根据上下文(瞎)蒙一个
(3)同一列的空值填上同一个数。


3. Expand Tables

补空位和展列表



4.split cells

分分合合

首先建立一个table.txt
table数据
然后,变变变💠

这块呢花花没有给“投食儿”,所以要根据原示例代码自学一下。先拿按列分割开刀

separate(data, col, into, sep = “[^[:alnum:]]+”, remove = TRUE,
convert = FALSE, extra = “warn”, fill = “warn”, …)

乍一看,懵了吧?对!那就拆一拆,解读一下吧~
data:数据框(前面讲了,bingo)
col:需要被拆分的列(bingo)
into:新建的列名,为字符串向量
sep:被拆分列的分隔符(bingo)
remove:是否删除被分割的列(Linux就接触过了,bingo)

好的,那就试一下吧~


Xmind

Xmind

        两天下来,R大哥还是可以的。
        摒除成见,友好相处,才是王道🤝
        深呼吸,放轻松,保持微笑🙂


上一篇下一篇

猜你喜欢

热点阅读