@IT·互联网Python文集python机器学习爬虫

2018世界杯数据分析——让你知道谁才是真正的黑马!!

2018-06-29  本文已影响575人  我叫钱小钱

特别声明:本文仅兴趣交流,感兴趣的水友也可以在下面留言,转载请联系作者。

2018_world_cup.jpg

2018俄罗斯世界杯正在如火如荼的举行,各种比赛预测多如牛毛,就在前两天看到一篇AI预测世界杯赛事很火,就自己也就尝试了一下,但是发现用机器学习模型预测比赛有几个问题。

所以放弃了预测的念头,就比较简单粗暴方法,分析了一下各队的性价比,话不多说先上图,快速预览请直接看黑体加粗。



由于图太大,很多国家标签没有显示,那么拆分成左右2块细看一下。

再来看下32支球队分布的情况,欧洲、美洲明显占据绝大区域。
好了~!分析一波就到这里了,剩下的大家自己看图分析吧。

  1. 在Kaggle上获取数据集,上面有从1872年到2018年的所有世界足球比赛结果数据(但是需要翻墙)
    官方链接:https://www.kaggle.com/martj42/international-football-results-from-1872-to-2017
  1. FIFA国际足联官方网站,排名,身价等(用Python抓取,当然也就32个队伍,百度搜一下复制黏贴也是可以的)
    官网链接:https://www.fifa.com/worldcup/players/

1.官网抓取的国际实际上和Kaggle的数据集国家英文关联不上,需要重新统一
2.Kaggle的历史的净胜球与主客场划分,需要划分时间进行拆分把他们拉到一个维度进行加权

最后再亮一下整理出来的本届世界杯32支球队的数据集


到这里就全部完成了,期待下一次分析请点关注,喜欢点赞~ !谢谢!
上一篇 下一篇

猜你喜欢

热点阅读