大数据部落机器学习与数据挖掘

拓端数据|数据+体育 数据挖掘在体育商业领域的应用

2017-07-20  本文已影响44人  拓端tecdat

关注我们请点击上方"拓端数据"↑

NFL球员的平均工资约为170万美元,中位数为63万美元。 NBA球员的平均工资约为510万美元,中位数为280万美元。 MLB玩家的平均工资约为410万美元,中位数为110万美元。同时可以看到明星球员的薪资远高于普通球员,拉高了平均水平。

团队支出和胜率的关系

从2016赛季初的团队支出和在常规赛中胜率的关系图中,我们可以看到团队支出对是否能赢得比赛有直接影响。

出席观众和日期的关系

从中我们可以发现日期和出席情况的关系,从而找到用于预测和评估出席率的模型。

球队实力表现

根据15年到16年NBA常规赛的20项指标进行综合分析,我们对 NBA参赛球队进行排序,评出最具实力的球队。

建模

预测观众出席人数——线性模型

估计获胜概率——蒙特卡罗模拟

当我们发现胜率符合经验分布的时候,使用蒙特卡罗模拟方法来估计某个队伍的获胜概率。

预测结果

可以看出,预测值的趋势已经基本与真实趋势保持一致。

模拟结果

通过对比赛日双方球队的表现模拟,我们得到下面的获胜概率热图,从ROC曲线的表现来看,模拟效果理想。

展望

除了以上列举的一些方法,tecdat已经在尝试更复杂的体育统计模型,如深度学习(Long Short-Term Memory网络、卷积神经网络(CNN))等;同时需要考虑到模型的可解释性、可落地性和可扩展性、避免“黑箱”预测;还在尝试采用混合的机器学习模型,比如GLM+SVR,GAM+ NNET等。

用数据驱动体育决策,这种看待体育的独特视角让我们能更好地察觉趋势、选取角度,同时帮助体育爱好者更深入地理解他们喜爱的运动队。

版权声明:为拓端数据原创文章,未经允许不得转载!


网页篇幅限制,请点击阅读原文”或关注公众号下载阅读报告全文。

版权声明:为拓端数据原创文章,未经允许不得转载!

【拓端数据tecdat.cn】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。

中国专业的统计分析和数据挖掘咨询服务商:拓端数据(商务合作请联系官网客服)

帅的小伙伴都关注了拓端数据团队^..^~

QQ交流群:186388004

微信公众号:拓端数据

微信客服号:lico_9e

上一篇 下一篇

猜你喜欢

热点阅读