集智俱乐部计算传播学

使用akshare分析2019ncov疫情微博指数

2020-02-19  本文已影响0人  c0659eed21f5

AkShare

AkShare 是基于 Python 的开源金融数据接口库, 目的是实现对股票, 期货, 期权, 基金, 外汇, 债券, 指数, 数字货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集, 数据清洗, 到数据落地的一套开源工具, 满足金融数据科学家, 数据科学爱好者在金融数据获取方面的需求.

AkShare 的特点是获取的是相对权威的金融数据网站公布的原始数据, 广大数据科学家可以利用原始数据进行各数据源之间的交叉验证, 进而再加工, 从而得出科学的结论.

针对新型冠状病毒肺炎疫情,akshare开发了事件接口,链接如下:

https://akshare.readthedocs.io/zh_CN/latest/data/event/event.html

安装

pip install akshare  --upgrade

对于国内用户anaconda使用者,推荐使用以下方法:

pip install akshare -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com  --user  --upgrade

使用

import akshare as ak
import pylab as plt
import pandas as pd
import seaborn as sns

# 提取数据
df_index4 = ak.weibo_index(word="武汉", time_type="3month")
df_index6 = ak.weibo_index(word="CDC", time_type="3month")
df_index7 = ak.weibo_index(word="钟南山", time_type="3month")
df_index5 = ak.weibo_index(word="疫情", time_type="3month")

然后,使用matplotlib进行可视化。

plt.figure(figsize=(12, 6), dpi = 200)
plt.style.use('fivethirtyeight')
plt.plot(df_index4.index, df_index4, label = '武汉', alpha = 0.5)
plt.plot(df_index5.index, df_index5, label = '疫情', alpha = 0.5)
plt.plot(df_index6.index, df_index6, label = 'CDC', alpha = 0.5)
plt.plot(df_index7.index, df_index7, label = '钟南山', alpha = 0.5)
plt.legend()
plt.yscale('log')
plt.xticks(rotation=60)
plt.ylabel('微博指数', fontsize = 20)
plt.show()
微博指数

练习

绘制下图:

江苏和南京
上一篇下一篇

猜你喜欢

热点阅读