研究一下某彩

2020-02-01  本文已影响0人  Ryan96

阶段学习完概率统计和数据分析的内容,之前也说了想拿这个练练手,如果能换点收入也许还不错(白日梦)

结论:彩票没有规律可循
期望收益为负,但可以用统计方法排除极个别号码(16年只出现一次这类的),中奖只能全靠运气,所谓专家或者可以预测的网站或是其他神棍方法一律不能信

一、各玩法中奖期望概率一致

先来简单介绍一下投注方式
1、玩法和介绍:

单选:在0~9中选择3个号
彩金为1040元,组选300元

组选:
一种是包含对子的三个号,奖金为300元左右
排列组合方式为3种

另一种是选3个号,排列组合方式为6种,但奖金为170元

2、概率和期望:
0~9共10个号码,预期概率是均匀分布(这点后面再根据历史记录分析),是放回型的,也就是10×10×10=1000种可能性

截图.png

可以看出期望上都差不多,既然期望概率上差不多,那么我们来看看数字频数分布情况,是否不是均匀分布,并且能提高中奖概率呢?

二、初步统计上没有发现规律
分析顺序
1、爬取所有数据
2、各位置数量频数分布
3、各号码组合出号情况
4、同期各数字联合频率分布
5、同一号码重复出现间隔天数

1、爬取相关数据
因为官网只有100期,所以爬了第三方网站的数据,然后做了一些数据清洗

2、所有时间和近30天频数分布
分为1,2,3位分别分析比较


1.png

可以看出长期来看频率的分布都差不多,长期的各位置频率极差为0.02,也就是2%,实际上想实用的话意义不大。
但是最近一个月内,2位上个别数字频率最大值达到了0.25,可以尝试用来预测。

3、组合出号概率

3 6 9    0.002565
5 7 3    0.002381
7 3 1    0.002198
6 6 9    0.002198
2 0 9    0.002198
6 6 7    0.002198
1 3 9    0.002198
0 2 0    0.002198
8 2 7    0.002198
3 9 3    0.002198

这些是组合出号最高的10个号码,最高的次数是14,在5000多条样本里,只出现了14次,这个不能拿来参考。

4.同期各数字联合频率分布

这个是总的频率


2.png

这个是最近30天的


4.png

可以看出出号还是很稳定的低,除了有些组合稍微比别的高那么一丁点外(真的是一丁点),概率很稳定没有什么相关性

把1,2,3列分别对比出来大于总体90%分位数的组合滤出来,然后合并到一起,做了一个排名,但是概率也没多高

    1  2  3
0  8  0  2
1  2  9  6
2  7  0  2
3  7  0  4
4  8  0  4
5  3  3  7

5.同一号码出现间隔

使用了全部时间的数据
出过号码后再出一次号码的间隔时间:
平均为832天,标准差是777天
所以可以得出没有规律可循

现在基本可以做出结论了

上一篇下一篇

猜你喜欢

热点阅读