《R语言实战》学习笔记---Chapter5(3) 高级数据管理

2023-08-19 本文已影响0人 RSP小白之路

我们在来看一些书中罗列的处理数据的其他比较有用的函数。

随机数函数

生成服从正态分布的伪随机数

通过函数set.seed()显式指定这个种子，这样下次复用代码依然可以使结果重现。

函数runif()用来生成0到1区间上服从均匀分布的伪随机数。

> runif(6)
[1] 0.8551465 0.3663286 0.4361905 0.7536699 0.6391011 0.9583179
> runif(6)
[1] 0.2430240 0.8443019 0.4113231 0.7202562 0.5849614 0.8344653
> set.seed(134)
> runif(6)
[1] 0.2003636 0.6275925 0.8814988 0.2512561 0.6099499 0.1697329
> set.seed(134)
> runif(6)
[1] 0.2003636 0.6275925 0.8814988 0.2512561 0.6099499 0.1697329

可以看到，没有设置随机种子前，两次调用函数生成的随机数序列是不同；但是设置之后，就实现了相同结果的复现。

其它实用函数

> x <- c(1,5,2,1,51,9)
> name <- "Jack"

> length(x)  #对象x的长度
[1] 6

> seq(0, 20,3) #从0至20，间距为3生成序列
[1]  0  3  6  9 12 15 18

> rep(1:3, 2)  #将1至3重复2次
[1] 1 2 3 1 2 3

> cut(1:10, 5, ordered_result = TRUE)   #将连续型变量 x 分割为有着 n 个水平的因子使用选项ordered_result = TRUE 以创建一个有序型因子
 [1] (0.991,2.8] (0.991,2.8] (2.8,4.6]   (2.8,4.6]   (4.6,6.4]   (4.6,6.4]   (6.4,8.2]   (6.4,8.2]   (8.2,10]    (8.2,10]   
Levels: (0.991,2.8] < (2.8,4.6] < (4.6,6.4] < (6.4,8.2] < (8.2,10]

> pretty(1:10, 20)  #创建美观的分割点。 通过选取n +1个等间距的取整值， 将一个连续型变量 x 分割为 n 个区间。 
 [1]  1.0  1.5  2.0  2.5  3.0  3.5  4.0  4.5  5.0  5.5  6.0  6.5  7.0  7.5  8.0  8.5  9.0  9.5 10.0

cat("Hello", name, file = "myfile", append = FALSE)  #连接若干个对象， 并将其输出到屏幕上或文件中（如果声明了一个的话）

表中的最后一个例子演示了在输出时转义字符的使用方法。 \n 表示新行， \t为制表符， \'为单引号，\b为退格。举个例子

> cat("Hello", name, "\n" , "How old \n are you?")  
Hello Jack 
 How old 
 are you?

《R语言实战》学习笔记---Chapter5(3) 高级数据管理

随机数函数

其它实用函数

猜你喜欢

热点阅读