贝叶斯统计视角看所谓的“赌徒谬误”

透过贝叶斯统计,很多貌似“非理性”的感性判断其实是理性的、最典型的就是抛硬币概率,每次抛硬币正反面结果的数学概率虽然都是1/2,不管先前连续多少次同为正面或同为反面、就当作没有任何干扰因素,只有随机要么正面要么反面地两边概率同为1/2,但这种数学结果的计算及其注意力其实明显是违反贝叶斯统计的,我们都知道事实上连续抛多次硬币结果都是某一面的话、要么是作弊,如果不作弊、接下来的结果是反面的”概率”确实是大得多的,因为概率的结果反应表现在大量数据的总体分布概况上,从大量数据总体分布的概况来看,概率各为1/2的随机结果在短期内集中得到单侧同一结果、那么接下来势必需要相反一侧的结果的出现概率更高、大量数据的分布状态才能符合“各占1/2”的表现,数学上的抛弃硬币”各占1/2”的概率表现并不仅仅是表现在单次抛硬币、更表现在连续多次抛硬币的热力学统计平均的结果反应上,所以如果连续多次抛硬币的热力学统计平均的结果预期需要对单次抛硬币的绝对各占1/2的理论模型构成挑战,“理性”地以为随机连续抛硬币连续得到同一结果后下一次抛硬币正反面概率依然稳定为各占1/2的这种“理性”,其实是值得怀疑的,其推理视角所依据的定义域太狭窄,相反依据贝叶斯统计预计那种情况下接下来出现另一结果的“概率”更高的期待则总是符合事实验证。


这里的问题关键不在于贝叶斯统计否定抛硬币这种独立事件的正反面均为概率1/2,而在于“单个独立事件”和“大量独立事件”的概率是相同的,当大量独立事件的事件分布因为偶然而表现出概率不等于1/2的时候,预期接下来独立事件的事件分布呈相反形态,也就是抛出好多次正面之后,接下来一连串的大量抛硬币事件得出反面结果更多而不是正反面相等、就几乎是必然的、否则就破坏总体上各占1/2概率的形态了,只有极少可能性,是抛硬币连续抛出多次正面后,又在多次抛硬币事件中正反各占一半,然后再慢慢平均掉,而是局部的不平均很快就会被平均掉了。也就是说尽管抛硬币这种“独立事件”无记忆,大量相互独立的抛硬币事件的事件形态分布走势要求纠正接下来的多个相互独立的抛硬币事件的事件动态分布、令其统计平均上收敛于1/2的时候,”独立事件”在局部表现在形象上也不会那么独立的。


有些钻牛角尖的学者会说了“这是赌徒谬误、以为概率1:1的赌博游戏连续赌输了10次下1次就能赢”,但事实上呢现实中的赌徒的真正谬误基本上没有是因为对概率误读而倾家荡产的~有的只是把自己看不出来的庄家出千当作是公正概率运作地下赌注而已,贝叶斯统计的感性印象根本就不纠结接下来的独立抛硬币事件是不是理论上的概率1:1,而是直接在预期接下来的众多抛硬币事件分布是否将总体概率给统计纠正得收敛回1:1,不是说看到连续10次抛硬币都是正面所以预期作弊、而是确认无作弊之后,看到连续抛10次硬币都是正面,那就合理预期接下来的连续抛硬币得出的结果要硬币修正这种局部不平均、抛出反面的结果就该更多,而贝叶斯统计的精髓、恰恰就是在这里了——虽然“理论上”可以偶然先抛10次硬币正面然后后来990次缓慢得几乎看不见地统计平均掉这种局部不平均,但是事实上概率1:1的事件,需要到+∞的事件数量才能抹除局部不平均,好像要通过非常非常广阔的定义域才能体现出统计平均那样的概率,本身就很低了,通常抛硬币几十次或接近100次就已经看出统计平均了,没有外力介入去拖延统计平均的出现的话!


前面说过【抛硬币这种“独立事件”无记忆,大量相互独立的抛硬币事件的事件形态分布走势要求纠正接下来的多个相互独立的抛硬币事件的事件动态分布、令其统计平均上收敛于1/2的时候,”独立事件”在局部表现在形象上也不会那么独立的】,并不是说独立事件在局部表现上不那么独立,而是”独立事件”在局部表现“在形象上”也会表现得貌似不那么独立的,这种”貌似”是可以合理把握的!因为必须稀释抹除掉局部的不平均、才能保持”全都是独立事件”的平均概率形态,而这种统计性的稀释(纠正),在古典概率解释中就是说”接下来的抛硬币事件、不能保证之前的偏差被修正,可能是许多许多趋向于无穷的事件样本、才能稀释之前的偏差”,然而实际上不存在这样的现实、因为统计方差增长缓慢,和样本增长之间不成正比,根本用不着非常非常非常浩瀚的样本,而是中短期内就能灵验了,如果需要很多很多样本,比如验证物理实验中的误差涨落、居然要几万次实验才能统计平均掉误差、这种情况是没有的,在热力学第二定律作用下无统计意义的局部不平均不需要很大的样本量、快速就能被平均掉!


很多所谓的“赌徒谬误”的说法其实自己就谬误在这里了,把别人对独立事件概率分布的事件分布图走势的预期当成了对单个独立事件的预期~所谓赌徒谬误中的”赌徒”们真正在预期的,大多数时候就不是真正赌徒赌博时押宝“下一次”什么形态的这1个截取出来的点,而是“接下来一系列事件”的分布形态,只是用“下次该出反面了”这个简略的口语表达,实际想说的是:“在接下来有限次抛掷中,反面的出现频率必然会高于正面,以纠正当前的偏差,而这种统计平均上的偏差纠正在独立事件的概率分布数据的数量增长中因为方差增长跟不上数据数量本身的增长、所以很快地方差的波动就要被收敛掉、那种统计修正自发地就要呈现出来,如果就钻牛角尖,抛前100次硬币正反结果数量比偶然30:70,本来事实上再抛300次大概率那个概率分布走势图就要平均掉这种显著的偏差,却非要说”有可能等到再抛10000次之后才显示出偏差,100次之后第10000次之前的9900次就依然大致正反数量1:1”,那这其实自己就违反概率事件分布走势图的展开规律了!


说到这里,精彩部分来了:贝叶斯统计的本质和精髓不是精确计算事件概率比例,而是通过假定先验概率后通过反馈事件的或然概率去作对预期或者对推理方面的实用拟合,那么在确认独立事件的抛硬币正反面概率就是1:1、前100次偶然得到正反面30:70,又合理得知这种偶然偏差在现实中中短期内就会被平均回归所自动纠正、纠正需要另一方向的偏差,而这种纠正其实不久就会出现、不需要等待非常非常多的抛硬币,比如不需要等待抛到第1万次之后才“终于”缓慢修正完,也就是说相反方向的偏差在中短期内就能把前100次抛硬币出现的,假设后300次抛硬币把前100次的偏差给修正得差不多,那么贝叶斯统计在预期”不包括已知的前100次偶然反常现象”、只预期后300次,自然这“后300次”抛硬币正反面比例接近70:30就是可预期的,平均下来,相当于后300次抛弃硬币每次正反面概率1:1的独立事件、大致等效于每次独立事件的正面概率其实可以被视作更大一点——因为存在统计上的“截断效应”,即只截取一段数据,出现偏差就是应该的~原本独立的事件、在截断效应的作用下可以透过”不独立”的倾向相互抵消的方式,已知部分偏离平均的局部数据的情况下截取另一部份的局部数据的信息、对这部分截取的信息进行评价、可等效赋予其貌似非独立事件的有偏差的形态!而刚才设定的抛硬币前100次偶然得到正反面30:70这就已经很反常了,说明其实抛硬币这种独立随机事件在现实中不到100次就已经很容易在向平均回归了、如果前50次出现了明显偏差、后50次出现相反方向的偏差的概率略微等效提高其实也是在实用上合理的。


要知道把人脑的非条件反射本能直观反应说成怎么蠢怎么蠢的那些“理性”,在生物学上也不理性,人脑在进化过程中形成的这些非条件反射直观反应如果真的这么蠢这么没用和误导,早就反馈压力逼迫得人类物种种群自组织反馈循环系统不得不修正自己了!

评论