1027 chapter 12 lubridate 日期和时间

2018-10-27  本文已影响0人  森尼啊

简介

library(lubridate) library(tidyverse) library(nycflights13)

创建日期或者时间

查看现在时间

 now()
[1] "2018-10-27 18:43:28 CST"

-了解下时间,PDT(Pacific Daylight Time)太平洋夏季时间,太平洋时间的标准时间从协调世界时减去8小时(UTC 8)。

创建日期或时间的三个方法

字符串创建

ymd(),mdy(),dmy(),ymd_hms(),mdy_hm(),数值带不带引号都可以
ymd(20181027) [1] "2018-10-27"

通过日期时间的各个成分的创建

日期各个成分分布在表格的多个列中。可使用make_date(), make_datetime()

通过现有的日期时间对象创建

as_datetime() 偏移量单位是秒和 as_date() 使用偏移量表示日期时间

p165练习题

  1. 无效日期会变成NA
ymd(c("2010-10-10","bananas"))
[1] "2010-10-10" NA          
Warning message:
 1 failed to parse.
?today

tzone   
a character vector specifying which time zone you would like to find the current date of. tzone defaults to the system time zone set on your computer.

主要是定义时区的,默认是电脑所设置时区。

mdy("January 1,2010")
[1] "2010-01-01"
ymd("2015-Mar-07")
[1] "2015-03-07"
dmy(06-Jun-2017)
Error in lapply(list(...), .num_to_date) : object 'Jun' not found
dmy("06-Jun-2017")
[1] "2017-06-06"
mdy(c("August 19 (2015)","July 1(2015)"))
[1] "2015-08-19" "2015-07-01"
mdy("12/30/14")
[1] "2014-12-30"

日期时间成分

获取成分

year(), month(),day(),mday()[一个月中的第几天,以下类推],yday(),wday(),hour(),minute(),second()
label = TRUE来返回月份名称和星期数 的缩写,abbr = FALSE,f返回全称

datetime <- ymd_hms("2018-10-27 19:19:40")
> month(datetime,label = TRUE)
[1] 十月
12 Levels: 一月 < 二月 < ... < 十二月
> wday(datetime, label = TRUE, abbr = FALSE)
[1] 星期六
7 Levels: 星期日 < ... < 星期六 # 我的电脑返回的是中文,不像书中的英语,是因为系统语言么?

舍入

floor_date(), round_date(),ceiling_date()

设置成分
①原地修改

datetime <- ymd_hms("2018-10-27 19:19:40")
 year(datetime) <- 2020
 datetime
[1] "2020-10-27 19:19:40 UTC"

② update()

update(datetime,year = 2020, month =  2, day = 2, hour = 2)
[1] "2020-02-02 02:19:40 UTC"

p170练习题

 flights_dt %>%
  mutate(time = hour(dep_time) * 100 + minute(dep_time),
         mon = as.factor(month
                         (dep_time))) %>%
  ggplot(aes(x = time, group = mon, colour = mon)) +
  geom_freqpoly(binwidth = 100)
Error in mutate_impl(.data, dots) : 
  Evaluation error: 'origin' must be supplied

2,

flights_dt %>%
  mutate(dep_time_ = sched_dep_time + dep_delay * 60) %>%
  filter(dep_time_ != dep_time) %>%
  select(dep_time_, dep_time, sched_dep_time, dep_delay)

因为有的午夜航班推迟后就是第二天了

flights_dt %>%
  mutate(flight_duration = as.numeric(arr_time - dep_time),
         air_time_mins = air_time,
         diff = flight_duration - air_time_mins) %>%
  select(origin, dest, flight_duration, air_time_mins, diff)

剩下的就不搬运答案了。。

时间间隔

时期,阶段,区间

时期

以秒为单位,as.duration(), dseconds()等
2*ddays(2)

阶段

seconds(),days(),years()

seconds(15)
[1] "15S"

阶段可以加减乘,也可以和日期相加

ymd(20181027) + dyears(1)
[1] "2019-10-27"

区间

next_year <- today()+years(1)
 (today()%--%next_year)/ddays(1)
[1] 365

p174

1, 没有dmonths的原因是 每个月的长度不一样
2.答案: overnight 和TRUE 或FALSE相等,如果过夜,为1天,没过夜,为0

  1. mday(1)想表达2015年的1月到12月,找不到好的表达式。。
ym(201501:201512)
Error in ym(201501:201512) : could not find function "ym"

答案:

ymd("2015-01-01") + months(0:11)
floor_date(today(), unit = "year") + months(0:11)
age <- function(bday) {
  (bday %--% today()) %/% years(1)
}
age(ymd("1990-10-12"))

5.要加个括号

(today() %--% (today() + years(1))) %/% months(1)
[1] 12

时区

国际标准IANA时区,<大陆>/<城市> like“America/New_York”

Sys.timezone() 
[1] "Asia/Taipei"

OlsonNames() 查找完整的时区名称列表
一般lubridate总是使用UTC时间

上一篇 下一篇

猜你喜欢

热点阅读