在某会计师事务所干审计的狗蛋老师经常和我吐槽,为什么上市公司搞幺蛾子都那么业余,留下众多“一眼假”的手尾,让他看了着急、上火、抑郁,直至怀疑人生。
我经常劝慰他,公众公司造假,本来就不是给专业人士看的。它只不过是按照监管要求,给散户们一个交代罢了,信不信的没那么重要。并且:
普通人的一辈子很短,很快就记不得这些烂事了。
这就好比临近年关的现在,众多资金沉淀的彩票池都成为堰塞湖,主管的民政部门的压力很大,特别需要多快好省地“疏通”。
于是,某些离奇操作重现江湖,把彩民们的智商按在地上摩擦。
继2023年12月2日以“顺子号”独中2.2亿的江西福彩事件后,2024年1月17日,中国体彩“排列5”玩法又曝出“5连号”狂揽5亿奖金、瞬间清空奖池的神迹。
其实,这个开奖公告说得还不够全面。因为同期开出的“排列3”中奖号码,居然也是类似的:
555。
这一期的彩票,据说创下了几个新的记录:
1、第一次开出豹子号(首次出现3同号与5同号);2、产生了5966注头奖,大幅度提高了中奖记录(此前最多一次产生998注头奖);3、排列五首次触发返奖风控机制;4、派奖总金额成为历史新高。
这种“大预言术”的玩法简单、爽感十足,成本还低——江西“快乐8”玩法中,为了清空2.2亿彩池,投注人硬是精准地分两次购买,前后花了十多万。而这次清空5亿彩池,大预言家只需要投入:
1万元。
而且,“快乐8”的中奖号“40,41,42,44,63,64,65”虽然有规律,但还是需要投注者保留一点残存的智商,一路法术吟唱去投注,这会给投注人产生一些心理压力。
而中国体彩的中奖体验就好上太多了,预言家只需要无脑输入5,即可完成法术瞬发。
如此体贴的设计,不禁让投注者仰天长啸、喜极而泣:
妈妈再也不要担心我的智商了。
1月18日,中国体彩客服回应记者称:
开奖全流程有网络直播,也有两名工作人员的监督,号码是随机摇出来的,不存在内幕和故障,开奖是真实有效的。
这下子,遍体鳞伤的A股股民终于发现,自己居然不是鄙视链的最低端,居然还可以嘲笑一番彩民…
倒是彩民朋友很淡定,他们纷纷发来贺电表示:
中奖密码55555,这波操作66666。
号码是随机的吗?
(一)随机抽样
简单科普一下,所谓“排列3”,就是从000-999的数字中随机选取三个数字投注,“排列5”则是从00000-99999中随机选五个数字投注。
一个反直觉的结论是:
随机生成5位数,得到55555和得到32167的概率完全相同;而在真正随机的抽样中,出现55555之类的特殊号,反而更符合概率论。
这个结论其实很好理解,因为现实中让你“生成5位随机数”,实质上等价于“生成5位的随机数列”——你在一个个写数字时会下意识地核对,避免出现连号。
因为你的大脑会提醒你:
出现55555的结果,似乎太假、太不随机了。
这个原理具有很重要的现实意义。
例如游戏设计者都知道,设计氪金游戏只能用“伪随机”。这是基于两方面的原因:
首先,计算机做不到真随机。无论是C语言中的“intrand(void)”,还是Java语言中的“Math.random()”,都是采用某种具体的算法,不是凭空生成的。有算法干预,就不是真随机。
其次,真随机会产生小概率事件,有时候会导致灾难性后果。举个例子,氪金游戏“充值一次、中奖概率1%”的充值抽卡环节,如果是真随机事件,乐子就大了。
因为1%的中奖,并不意味着抽1次就必然中奖一次。我们可以通过帕斯卡定理计算得出,连续100次都不中奖的概率为:
也就是说,充值100次,“不中奖”的悲催结果,居然超过了:
1/3。
而现实中,你连抽1000次都中奖,和连抽1000万次都不中奖,都完全符合真随机的原则。
(独立随机事件,相当于从盲盒中有放回地摸球、形成各种组合的概率)
对于游戏公司而言,这样的真随机是完全不可接受的(unacceptable,不是某些无良媒体翻译的“可接受的”)。
一方面,游戏公司害怕因抽卡中奖过多,导致游戏内物价体系的崩溃,从而影响游戏寿命;另一方面,游戏公司更害怕玩家因“非酋体质”,在连续抽卡不中的情况下道心不稳、质疑“黑幕”,导致不可控事件的发生。
因此,游戏公司必然采用某种伪随机算法,使得结果符合普通人的“预期”。
例如下面两幅随机roll点生成的点阵图,左边这副就是加入“避免过度聚集”的算法,右边这个时而密集时而发散、看上去有规律的图,反而更可能是“真·随机图”。
(伪随机反而需要争取“均匀”的分布)
我们来做一次“思维体操”,假设游戏公司一时想不开,开展了虚拟彩票业务,那么就很好理解了:
如果彩票中心是真随机抽样,抽出顺子号(如12345)和豹子号(如55555)是完全合理的,这反而证明了彩票中心的公正性。
但这一切都有一个前提:
彩票中心抽出中奖号码,严格符合真随机抽样。
问题就在于,截止目前,计算机程序还做不到真随机,以计算机程序抽奖的彩票中心自然也是如此。
所以人们就有质疑的理由,且大家的怀疑,反过来又可以从数学中得到某种证明。
(二)贝叶斯公式
如果在概率论中评选一个最重要的公式,贝叶斯公式将以全票当选。它甚至是目前“大数据+算法+算力”的AI模型的理论基础。
贝叶斯公式非常简洁优美,它解决了“逆向概率”的计算问题,描绘的是“在事件B发生的情况下事件A发生的可能性”。
如果我们承认彩票中心用“非随机算法”生成随机数,则可以把“彩票中心程序出bug”当作事件A,把“中奖号码为55555”作为事件B。
那么人们关心的事件P(A|B)就是:
在已知中奖号码是55555的条件下,彩票中心出现bug事件的概率有多大。
我们简单分解一下:
这里有几个重要概念:
把以上概念代入贝叶斯公式,显然可以得到一个基本结论:
只要(P(B│A^c))/(P(B│A))足够小,后验概率P(A|B)非常接近于1。
翻译成为大白话就是:
当“程序没问题但抽出55555的概率”与“程序有问题且抽出55555的概率”的比值,显著小于“程序有问题的概率”时,“抽奖程序有问题”将是大概率发生的事情。
这是什么意思呢?继续用思维体操的方式进行解释:
你和好基友玩“抛硬币猜正反面”游戏。你知道他是个脑子过于灵泛的人,有可能采用作弊;但你认为对方作弊的概率不大(也许是他珍惜和你的友谊,也许是你发现作弊会揍他),总之你观测并估计到:
你的好朋友使用作弊硬币(双面都是正面图案)的概率是0.1%,使用正常硬币(标准的正反两面硬币)的概率是99.9%。
现在,你的好友当着你的面,连续20次抛出了正面图案。
你开动自己太久不用而生锈的脑袋瓜子,套用贝叶斯公式计算得到结论:
好朋友使用双正面硬币作弊的概率(即后验概率P(A|B))无限接近于99.9%。
这就是你掀桌子中止游戏,并检查游戏道具(硬币)的理由。
凡事就怕有对比
据说帕斯卡创立概率论,是为了指导自己逛赌场时的投注策略,而我上学时沉湎于概率论,是为了更好地理解各种游戏的运行机制。
然鹅我们知道,概率论这门学科到了东方,也得尊重现实国情。
例如现阶段,彩民无法去验证彩票中心抽奖程序。甚至于,彩票中心连抽样直播都做不到(电视上播放的抽样节目是录制播放的),因而会产生很多千奇百怪的争议。
以及,彩票中心永远不会公布大奖得主的基本信息。
例如在上个月江西福彩事件中,面对媒体记者的采访,有关部门以“保护个人隐私”为由而拒绝提供查询服务。
于是我们见证了各种扮相的中奖者,不知道的还以为是误入了儿童乐园。
这都是什么牛马大会啊!
再次然鹅,凡事就怕有对比——让我们看看万恶的美帝是怎么监督彩票行业的。
2010年,美国爱荷华州彩票协会的工作人员埃迪·蒂普顿被指控非法操控“热乐透”(HotLotto)彩票中奖号码,涉案金额高达1650万美元。
调查人员发现,蒂普顿早年是该彩票协会的软件工程师,后来又升任为安全主管。他利用工作机会,在抽奖程序中植入了额外的21行代码,达到提高中奖概率的目的。
埃迪·蒂普顿的作案手法是这样的:
第一步,将一年中的某三天预设为特定日期,系统检测到日期即触发特定事件的判定条件。第二步,如果检测到的特定日期恰巧是彩票开奖日,那么当天的彩票号码生产程序将不再随机生成数字,而是通过特定算法产生受控数字。第三步,用新算法生产的数字并不是指定的数,而是在缩小的彩票选号范围内生成的随机数(打个比方,把00000-99999里随机选3个数字,变更为0-9里选3个数字,这样只需要买93=729注号码,就一定能中奖。当然,实际算法没有这么简单)。第四步,蒂普顿与兄弟、好友一起,先后操纵了6次彩票开奖,牟利共2400万美元。
(HotLotto的中奖规则很简单,就是抽出5个号码,每个号码是1-2位数字,因而便于操控)
这个案例告诉我们(尤其是告诉那些迷信技术的专家及彩民)两件事:
貌似公正随机的抽奖程序,其实并不是真正的随机;抽奖程序是人类设计的,存在被植入后门的技术性手段。
然鹅,技术上有bug不可怕,有人以身试法也不可怕,只需要通过有效的制度设计发现问题、解决问题,同时保持透明度即可。
狡猾的埃迪·蒂普顿是如何露出马脚的呢?
因为这家死板的美国彩票公司规定,中奖者需要到现场领奖,并公开个人信息。
埃迪·蒂普顿先是找了自家兄弟、朋友代为领奖。但每次中奖信息都是联网的,很快,蒂普顿发现:
中了几次奖之后,可以信任的代领者不够用了…
于是,悲催的蒂普顿琢磨了各种擦边球领奖方式。
例如他冒充外国人,现场领奖不方便,希望改为线上,被拒。
例如他成立了一家信托公司,让律师代理领取该笔奖金。但由于不肯透露彩票所有者的身份,这次试探被拒,并被彩票公司报警。
于是,喜气洋洋的中奖成为了严肃的刑事调查事件。在警方介入调查后,蒂普顿迅速被锁定,随后翻车。
2017年,埃迪·蒂普顿因彩票欺诈和计算机犯罪,面临长达13年的监禁和35000美元罚款。
(当时的媒体报道。这是埃迪·蒂普顿的弟弟,向警方自首的汤米·蒂普顿)
我的朋友狗蛋迅速地总结了中心思想:
这说明美国的彩票部门管理僵化,不尊重公民隐私。
陀思妥耶夫斯基在《卡拉马佐夫兄弟》总结道:
俄罗斯这片大地太需要荒诞了。世界建立在荒诞之上,缺少荒诞,大地上一无所有。
我觉得吧,这位陀思妥耶夫斯基先生,你最好是在说俄罗斯。