用数据来看疫情拐点—它真的来了吗?
2020,努力做一个无可替代的人!
写在前面的话
前面我们写了一篇关于疫情数据自动获取,并且通过邮件定时发送的文章,感兴趣的同学的可以自己了解,我贴一下链接:
提到这一篇是因为它是我们今天内容的部分数据来源
上一篇文章发布于2月15号,但是我在12号就已经在爬数据了。
12号丁香园疫情平台新增“当前确诊人数”列,之前是没有这个字段的。
另外12号之前的数据来源于github,我大致检查处理了一下,数据没啥大问题,不影响我们今天的分析
正文
到目前为止,我们拿到最早的数据是1月23号, 全国总确诊866人。
23号之前的数据确实没有找到,这个我特意找过。
如果有同学知道这部分数据的来源,可以留言告知我,不胜感谢!
数据部分需要交待的就这些,我们的数据不是从0开始的,这点大家需要留意。
今天需要提到一个概念:拐点
在数学上,拐点又称反曲点,是指改变曲线向上或向下方向的点,即连续曲线的凹弧与凸弧的分界点。
这个概念大家应该都没忘,高中数学里面的,网上找了张图:
文章首发:公众号『知秋小梦』这样一看,拐点还是很好判断的。
如果只是单纯的根据曲线去判断拐点,确实还挺简单的。
首先先来看一下目前的疫情分布:
这个疫情分布图我们在上节已经实现了,并且每天会邮件发送给留邮箱的同学
看下这个分布图,显示的是从疫情开始到目前为止的累计数据
当然,我猜你可能还想看到这张图:
文章首发:公众号『知秋小梦』这张图显示的是目前还确诊的人数,像青海、西藏的确诊病例已经痊愈了,就会显示为0。
也是因为一位朋友的提醒,从明天开始邮件的分布图内容会由第一张图换成图第二张图。
原因其实很简单,朋友说了一句:
“第一张图对我没用”
确实是,对于在疫情区的人来说,最希望自己所在的区域会像西藏、青海一样当前为0。
这一点,是小一我欠缺考虑,前面留邮箱的同学注意一下变动噢。
再来说大家比较感兴趣的问题:疫情拐点来了吗?
说这个问题之前,先来看图,我觉得图是很能说明问题的
文章首发:公众号『知秋小梦』这是从1月23号起到昨天的全国疫情数据图
需要注意一点的是,2月12号疫情确诊的标准由原来的核酸检测订正成临床检测,所以才会在一天之内出现一个激增。
如果单从累计确诊人数的曲线来看,拐点是符合我们数学上提到的拐点定义,但是小一我总觉得单靠一个累计确诊的指标就说拐点到了,有点...
况且新增确诊人数的曲线好像有上升趋势,累计死亡人数也还在上升通道中。
小一我大胆预测一下,大家就当看个热闹
如果哪天累计确诊、新增确诊人数和死亡人数都出现拐点了,可能那才是我们想要的拐点吧
再来看一张图
文章首发:公众号『知秋小梦』这是从1月23号起到昨天的全国(除湖北省)疫情数据图
单看累计确诊人数确实很符合,但是医学上应该不是单纯的只看这一个指标吧?
而且严谨一点的还会通过模型去验证,不光是我们用眼力去看这种。
不过,令人欣慰的是,不论是全国数据还是除湖北省的数据,治愈人数和治愈率都在加速上升阶段。
全国的数据显示治愈率已经快上升到25%
,除湖北省外的全国数据显示治愈率更是超过50%
有一说一,在疫情防控方面我们做的非常有效,大家窝在家的效果也特别显著。
通过上面的分析,可以看到,在这场没有硝烟的特殊战役中,我们已经取得了初步成效
只要曲线的拐点齐至,那它就是我们想要的拐。
不过,在目前阶段,疫情得到遏制,但拐点未至,还需要大家一起继续努力去战胜疫情。
写在后面的话
关于数据
前面说过,2月12号之前的数据从github 上获取,之后的数据是上节的爬虫程序每天定时爬取的
爬虫是每天早上八九点运行,所以数据可能会和官方的有出入,毕竟官方的数据也是在随时更新
关于源码
这节的内容画图是用seaborn 画的,数据处理啥的也比较简单,我代码都有写注释
本节代码也已经上传github,需要源码的在公众号后台
回复 继续加油
获取
对数据、代码等有问题的同学可以加群交流(后台回复加群
)
原创不易,欢迎点赞噢
文章首发:公众号【知秋小梦】
文章同步:掘金,简书,csdn,segmentfault