彩票是一种很简单的数字游戏,但简单的几个数字通过排列组合又衍生了让人眼花缭乱的变化。
就拿全国联销的双色球来说,规则很简单:从33个红球里面选择6个红球,再从16个蓝球中选择1个,只要全部正确就中得一等奖。
既然是规则简单,投注门槛又低,那谁不乐意来两注呢。买了两注没中,不就得反思一下怎么才能提高双色球中奖概率?于是乎彩民们提出了各种“提高”彩票中奖率的方法。走势图是一定要有的,还要有冷号、热号分析,大小号、区间分析、再加上天干地支、牛鬼蛇神……
我也给大家抛一个图,“指导”大家投注(近期双色球红球的分析),嘿嘿

声明如下:
- 灵感来自于传媒大学沈浩教授,只不过我不会使用 Clementine。
- 虽然我是彩票从业者,但对此不负任何法律以及学术责任。
- 具体怎么选,或解读这幅图,请参考双色球冷热号选号方法。
- 纯属娱乐,观众可洗洗睡了^_^
深圳福彩3000万巨奖诈骗案发生后,好多朋友开始质疑中国福利彩票的公正性,并向我询问福利彩票是不是真的如传闻那样–福利彩票自产自销?。由于身在中福彩的原因,很多支持福彩公正的内情不太合适发布在网上,但–数据一汇总,上帝也会发笑。这篇博文从一等奖中奖概率分布的角度给各位童鞋聊聊福彩的公正性。
现在每一期的福彩双色球销售额大概是2亿左右(已持续很长时间),每注双色球为2元,就是说每期双色球的销售大概会有1亿人次参与。
在随机选择,且每次抽取都是等概率的的假定条件下,理论的重复彩票注数的分布(0注至41注)如下:

一等奖是完全随机出现的,那么在假设条件下,一等奖同时出现五注的概率最高,六注、四注其次,再次为七注、三注,类推……当然理论上,没有中奖(0注)和中12注以上的概率相比其他情形低了很多。
那么我们再看一看福利彩票双色球每期中一等奖(2008年1月1日至2009年7月23日)的实际分布情况:

有童鞋看出端倪了:实际数据的分布同理论上的分布是不一致的!理论上的一等奖出现概率最大在出现五注的位置,而实际上一等奖出现的最大概率出现在了两注的位置。
为什么会出现这样的情况?主要是因为我们最开始的假设是有问题。
双色球每期销售会有1亿人次的彩民参与?不可能!双色球的覆盖度没有那么大。
一些彩民为了提高中奖概率(或者说迷信一些选号方法),会采用”复式”、”胆拖”、”倍投”等方式投注,当然大部分彩民还是会老老实实的买一注。综合考虑到这些因素以后,凭经验估计样本量应该为现在的一半左右,即5000万。这样看来较为合理的一等奖中奖概率理论上分布为:

此时理论分布同实际分布已经非常相似。
实际双色球一等奖分布的右边尾巴上恰恰显示了”复式”、”胆拖”、”倍投”的投注效果。
再插一句:
深圳福彩3000万大奖诈骗犯身份曝光一文中提到:
警方调查发现,程某先是编写了一个可以自动运行的木马软件,然后利用与福彩中心合作的机会,进入福彩中心机房,植入自动运行的木马程序。一旦摇奖结果出来,这个程序会自动将程某所购买的彩票修改成一等奖的号码。
这里可以推测程某天真地以为满足兑大奖的条件为:
- 数据库里的数据正确;
- 实体彩票存在。
恩,没有问题!但,这两个条件可是通过很多很多很多的手段来监管的。
话说最近两个月一直再买双色球,而且用“守号”策略,每期必买:
红:”03″,”09″,”12″,”22″,”24″,”33″
蓝:”07″
虽说只中过一次 5 RMB,但仍然乐此不疲。只是有一点不是太爽,每次开奖之后必须要去中彩网 看是否中奖,麻烦的很。然后么,写了几行 R 代码,自动让 R 去匹配开奖结果。每天当我打开 R 是,R 会告诉我中了几等奖~~(当然一般都不中-_-)
为了方便广大的彩票爱好者和 R 爱好者,我把具体用法贴出来——在 R 主目录 etc 下 Rprofile.site 文件加这么几行:
# 选择红色球
pick_red <- c("03","09","12","22","24","33")
#选择的蓝色球
pick_blue <- "07"
source("http://sunbjt.googlepages.com/TB.r")
一般呢,当你打开R时,你会看到”Try again,loser!”。中奖是很难的,嘿嘿!如果你以0.000000005642994 的概率成为幸运儿的话,别忘了告诉我喔。