呆鸟的Python数据分析小一的数据分析之路

用数据来看疫情拐点—它真的来了吗?

2020-02-23  本文已影响0人  小一不二三
文章首发:公众号『知秋小梦』

2020,努力做一个无可替代的人!


写在前面的话

前面我们写了一篇关于疫情数据自动获取,并且通过邮件定时发送的文章,感兴趣的同学的可以自己了解,我贴一下链接:

提到这一篇是因为它是我们今天内容的部分数据来源

上一篇文章发布于2月15号,但是我在12号就已经在爬数据了。

12号丁香园疫情平台新增“当前确诊人数”列,之前是没有这个字段的。

另外12号之前的数据来源于github,我大致检查处理了一下,数据没啥大问题,不影响我们今天的分析

正文

到目前为止,我们拿到最早的数据是1月23号, 全国总确诊866人。

23号之前的数据确实没有找到,这个我特意找过。

如果有同学知道这部分数据的来源,可以留言告知我,不胜感谢!

数据部分需要交待的就这些,我们的数据不是从0开始的,这点大家需要留意。

今天需要提到一个概念:拐点

在数学上,拐点又称反曲点,是指改变曲线向上或向下方向的点,即连续曲线的凹弧与凸弧的分界点。

这个概念大家应该都没忘,高中数学里面的,网上找了张图:

文章首发:公众号『知秋小梦』

这样一看,拐点还是很好判断的。

如果只是单纯的根据曲线去判断拐点,确实还挺简单的。

首先先来看一下目前的疫情分布:

文章首发:公众号『知秋小梦』

这个疫情分布图我们在上节已经实现了,并且每天会邮件发送给留邮箱的同学

看下这个分布图,显示的是从疫情开始到目前为止的累计数据

当然,我猜你可能还想看到这张图:

文章首发:公众号『知秋小梦』

这张图显示的是目前还确诊的人数,像青海、西藏的确诊病例已经痊愈了,就会显示为0。

也是因为一位朋友的提醒,从明天开始邮件的分布图内容会由第一张图换成图第二张图。

原因其实很简单,朋友说了一句:

“第一张图对我没用”

确实是,对于在疫情区的人来说,最希望自己所在的区域会像西藏、青海一样当前为0。

这一点,是小一我欠缺考虑,前面留邮箱的同学注意一下变动噢。

再来说大家比较感兴趣的问题:疫情拐点来了吗?

说这个问题之前,先来看图,我觉得图是很能说明问题的

文章首发:公众号『知秋小梦』

这是从1月23号起到昨天的全国疫情数据图

需要注意一点的是,2月12号疫情确诊的标准由原来的核酸检测订正成临床检测,所以才会在一天之内出现一个激增。

如果单从累计确诊人数的曲线来看,拐点是符合我们数学上提到的拐点定义,但是小一我总觉得单靠一个累计确诊的指标就说拐点到了,有点...

况且新增确诊人数的曲线好像有上升趋势,累计死亡人数也还在上升通道中。

小一我大胆预测一下,大家就当看个热闹

如果哪天累计确诊、新增确诊人数和死亡人数都出现拐点了,可能那才是我们想要的拐点吧

再来看一张图

文章首发:公众号『知秋小梦』

这是从1月23号起到昨天的全国(除湖北省)疫情数据图

单看累计确诊人数确实很符合,但是医学上应该不是单纯的只看这一个指标吧?

而且严谨一点的还会通过模型去验证,不光是我们用眼力去看这种。

不过,令人欣慰的是,不论是全国数据还是除湖北省的数据,治愈人数和治愈率都在加速上升阶段。

全国的数据显示治愈率已经快上升到25%,除湖北省外的全国数据显示治愈率更是超过50%

有一说一,在疫情防控方面我们做的非常有效,大家窝在家的效果也特别显著。

通过上面的分析,可以看到,在这场没有硝烟的特殊战役中,我们已经取得了初步成效
只要曲线的拐点齐至,那它就是我们想要的拐。


不过,在目前阶段,疫情得到遏制,但拐点未至,还需要大家一起继续努力去战胜疫情。

写在后面的话

关于数据

前面说过,2月12号之前的数据从github 上获取,之后的数据是上节的爬虫程序每天定时爬取的

爬虫是每天早上八九点运行,所以数据可能会和官方的有出入,毕竟官方的数据也是在随时更新

关于源码

这节的内容画图是用seaborn 画的,数据处理啥的也比较简单,我代码都有写注释

本节代码也已经上传github,需要源码的在公众号后台回复 继续加油 获取

对数据、代码等有问题的同学可以加群交流(后台回复加群

原创不易,欢迎点赞噢

文章首发:公众号【知秋小梦】

文章同步:掘金,简书,csdn,segmentfault

原文链接:疫情拐点,你真的来了吗?
上一篇下一篇

猜你喜欢

热点阅读