赤裸裸统计学(三):统计数字会撒谎

2020-11-04  本文已影响0人  测序九月

      原始数据是多维而混乱的,统计学的过程就是将混乱的数据提取精炼成可读的数字。在LOL中我常常为其他人介绍自己喜欢的选手,比如uzi,但我不可能拿着uzi所有比赛录像告诉他人,uzi比赛是我喜欢uzi的原因。

      在一场比赛中我们常常使用KDA来说明一个选手的发挥情况,这简化了我们对比的工作,但同时也会使我们受到统计数字的欺骗。一个最直接的便是各种指标在KDA中的占比,LOL是个推塔的游戏,推塔重不重要?重要!那么提高推塔的比例,KDA肯定和之前的KDA不同,最可怕的是两个KDA都是真实无造假的。所以统计指标第一个问题便是权重比例问题。

        我们在uzi的比赛中每每能看到下路被针对的情况,内心焦急万分,虽然uzi大多时候奇迹般的坚持到大后期,但也会有守不住的时候,uzi的KDA就会奇低,但能说uzi没实力吗?不能,这就是统计数字的第二个问题,无法面面俱到的展示。

        ADC这个位置非神即鬼,即使是uzi也会有针对太狠打不出节奏的时候,个别黑子用uzi平均KDA去评价uzi,这是不合适的,因为从KDA的中位数来看uzi的第一当之无愧。这是统计数据的第三个问题,别有用心的人会选择对自己观点有利的统计方式。

        统计数据的第四个问题就是混淆单位给人错误的结论,从KDA上看刘青松没上单高,刘青松不如上单,这很明显不对,刘青松是辅助,不应该跨过位置去对比。

        如果KDA最为唯一指标,那么KDA高的不一定强, 因为此时最优解为:放弃可能输的团战,死保KDA.

上一篇 下一篇

猜你喜欢

热点阅读