1027 chapter 12 lubridate 日期和时间
简介
library(lubridate) library(tidyverse) library(nycflights13)
创建日期或者时间
查看现在时间
now()
[1] "2018-10-27 18:43:28 CST"
-了解下时间,PDT(Pacific Daylight Time)太平洋夏季时间,太平洋时间的标准时间从协调世界时减去8小时(UTC 8)。
- 而CST是美国、澳大利亚、古巴或中国的[标准时间]
1、美国中部时间:Central Standard Time ([USA] UT-6:00;
2、澳大利亚中部时间:Central Standard Time (Australia) UT+9:30;
3、中国[标准时间]: China Standard Time UT+8:00;
4、古巴[标准时间]:Cuba Standard Time UT-4:00。 - UTC: 协调世界时,是以[原子时秒长为基础,在时刻上尽量接近于的一种时间计量系统。
创建日期或时间的三个方法
字符串创建
ymd(),mdy(),dmy(),ymd_hms(),mdy_hm(),数值带不带引号都可以
ymd(20181027) [1] "2018-10-27"
通过日期时间的各个成分的创建
日期各个成分分布在表格的多个列中。可使用make_date(), make_datetime()
通过现有的日期时间对象创建
as_datetime() 偏移量单位是秒和 as_date() 使用偏移量表示日期时间
p165练习题
- 无效日期会变成NA
ymd(c("2010-10-10","bananas"))
[1] "2010-10-10" NA
Warning message:
1 failed to parse.
?today
tzone
a character vector specifying which time zone you would like to find the current date of. tzone defaults to the system time zone set on your computer.
主要是定义时区的,默认是电脑所设置时区。
mdy("January 1,2010")
[1] "2010-01-01"
ymd("2015-Mar-07")
[1] "2015-03-07"
dmy(06-Jun-2017)
Error in lapply(list(...), .num_to_date) : object 'Jun' not found
dmy("06-Jun-2017")
[1] "2017-06-06"
mdy(c("August 19 (2015)","July 1(2015)"))
[1] "2015-08-19" "2015-07-01"
mdy("12/30/14")
[1] "2014-12-30"
日期时间成分
获取成分
year(), month(),day(),mday()[一个月中的第几天,以下类推],yday(),wday(),hour(),minute(),second()
label = TRUE来返回月份名称和星期数 的缩写,abbr = FALSE,f返回全称
datetime <- ymd_hms("2018-10-27 19:19:40")
> month(datetime,label = TRUE)
[1] 十月
12 Levels: 一月 < 二月 < ... < 十二月
> wday(datetime, label = TRUE, abbr = FALSE)
[1] 星期六
7 Levels: 星期日 < ... < 星期六 # 我的电脑返回的是中文,不像书中的英语,是因为系统语言么?
舍入
floor_date(), round_date(),ceiling_date()
设置成分
①原地修改
datetime <- ymd_hms("2018-10-27 19:19:40")
year(datetime) <- 2020
datetime
[1] "2020-10-27 19:19:40 UTC"
② update()
update(datetime,year = 2020, month = 2, day = 2, hour = 2)
[1] "2020-02-02 02:19:40 UTC"
p170练习题
flights_dt %>%
mutate(time = hour(dep_time) * 100 + minute(dep_time),
mon = as.factor(month
(dep_time))) %>%
ggplot(aes(x = time, group = mon, colour = mon)) +
geom_freqpoly(binwidth = 100)
Error in mutate_impl(.data, dots) :
Evaluation error: 'origin' must be supplied
2,
flights_dt %>%
mutate(dep_time_ = sched_dep_time + dep_delay * 60) %>%
filter(dep_time_ != dep_time) %>%
select(dep_time_, dep_time, sched_dep_time, dep_delay)
因为有的午夜航班推迟后就是第二天了
flights_dt %>%
mutate(flight_duration = as.numeric(arr_time - dep_time),
air_time_mins = air_time,
diff = flight_duration - air_time_mins) %>%
select(origin, dest, flight_duration, air_time_mins, diff)
剩下的就不搬运答案了。。
时间间隔
时期,阶段,区间
时期
以秒为单位,as.duration(), dseconds()等
2*ddays(2)
阶段
seconds(),days(),years()
seconds(15)
[1] "15S"
阶段可以加减乘,也可以和日期相加
ymd(20181027) + dyears(1)
[1] "2019-10-27"
区间
next_year <- today()+years(1)
(today()%--%next_year)/ddays(1)
[1] 365
p174
1, 没有dmonths的原因是 每个月的长度不一样
2.答案: overnight 和TRUE 或FALSE相等,如果过夜,为1天,没过夜,为0
- mday(1)想表达2015年的1月到12月,找不到好的表达式。。
ym(201501:201512)
Error in ym(201501:201512) : could not find function "ym"
答案:
ymd("2015-01-01") + months(0:11)
floor_date(today(), unit = "year") + months(0:11)
age <- function(bday) {
(bday %--% today()) %/% years(1)
}
age(ymd("1990-10-12"))
5.要加个括号
(today() %--% (today() + years(1))) %/% months(1)
[1] 12
时区
国际标准IANA时区,<大陆>/<城市> like“America/New_York”
Sys.timezone()
[1] "Asia/Taipei"
OlsonNames()
查找完整的时区名称列表
一般lubridate总是使用UTC时间
- 修改时区的两种方法
- ①修改其显示方式
with_tz()
-②修改内部时间
force_tz()