利用Python进行数据分析(5)- 时间序列基础
2020-05-10 本文已影响0人
皮皮大
Python-for-data-时间序列、频率和移位
本文中主要介绍的是pandas中时间序列基础、日期生成及选择、频率和移位等。
image
时间序列基础
pandas中的基础时间序列种类是时间戳索引的Series;在pandas的外部则表现为Python字符串或者datatime对象。
时间序列作为S型数据索引(不连续)
image
生成连续的S型数据索引
通过date_range方法实现,4个参数:
-
开始时间
-
结束时间
-
频率,默认是天
-
指定的长度
[图片上传失败...(image-dfb02e-1589117557082)]
时间序列算术上的对齐
image
索引、选择、子集
索引
image-20200510204103807
选择
image
重复索引的处理
image-20200510204456405
日期范围、频率和移位
日期范围
两个主要的函数:
-
date_range:生成的是DatetimeIndex格式的日期序列 -
period_range:生成PeriodIndex的时期日期序列
image
频率和日期偏置
pandas中的频率由基础频率和倍数频率组成。
-
基础频率通常会有字符串别名
-
基础频率前面放置一个倍数,形成倍数频率
image-20200510204841523
生成带频率的数据
image
锚定偏置量
频率描述点的时间并不是均匀分布的,'M'表示月末,'BM'表示月内最后的工作日,取决于当月天数
移位shift
Shift用法
image
image
使用偏置进行移位日期
pandas日期偏置可以使用datetime或者Timestamp对象完成
image
锚定偏置量
image
移位和groupby连用
image