理论教育 皮尔逊教授设计的非随机检定方法及其对随机现象的启示

皮尔逊教授设计的非随机检定方法及其对随机现象的启示

时间:2023-06-01 理论教育 版权反馈
【摘要】:皮尔逊教授设计的非随机检定方法,其实是做偏离正常值的检定,但就目的来说,属同一回事。1902年7月,他调查了数百万个所谓的蒙特·卡罗结果,发现这些结果并非完全随机,而且具有很高的统计重要性,其误差低于10-9。皮尔逊教授等学者很早就对创造人为随机数据发生器很感兴趣,由此得出的随机数表,可以作为各种科学和工程仿真的输入资料。问题出在他们不希望这些随机数表呈现任何形式的规则性,而真正的随机现象看起来并不随机!

皮尔逊教授设计的非随机检定方法及其对随机现象的启示

20世纪初,学者开始发展各种技术来处理随机结果的概念。有几种方法被人设计出来,用以察觉异常现象(anomalies)。皮尔逊(Karl Pearson)教授设计出第一种非随机检定方法。上过统计学入门课程的人都知道奈曼-皮尔逊(Neyman-Pearson)检定法。皮尔逊教授设计的非随机检定方法,其实是做偏离正常值的检定,但就目的来说,属同一回事。1902年7月,他调查了数百万个所谓的蒙特·卡罗结果,发现这些结果并非完全随机,而且具有很高的统计重要性,其误差低于10-9。什么?转盘转出的结果不随机?这个发现令皮尔逊教授大吃一惊。但是这个结果本身并没有告诉我们什么事情;我们知道世界上根本没有纯随机抽样这种东西,因为抽样的结果取决于设备的品质。够多的小事集中在一起,我们就能在某些地方发现非随机现象,例如转盘本身可能不是摆得很平,或者旋转的球不是很圆。统计学的哲学家把这叫做参考个案问题(reference case problem),用以解释实务上没办法真正取得随机,只有理论上才找得到。此外,经理人会质疑这种非随机现象能否造就真的能够赚钱的法则。如果我需要赌一万次,每次一块钱,才可望赚到一块钱,那不如兼差去当大楼管理员。

但是这个结果还有另一个可疑的成分。这里和实务更有关系的地方,是下面所说非随机性的严重问题。连这位统计学之父也忘了随机连续序列不一定要呈现随机的模式(pattern);事实上,数据如果完美到未呈现任何模式,反倒十分可疑,让人觉得有捏造之嫌。单一的随机连续序列势必呈现某种模式——如果我们努力去找的话,一定找得到。皮尔逊教授等学者很早就对创造人为随机数据发生器很感兴趣,由此得出的随机数表,可以作为各种科学和工程仿真(蒙特·卡罗仿真器的前身)的输入资料。问题出在他们不希望这些随机数表呈现任何形式的规则性,而真正的随机现象看起来并不随机!(www.daowen.com)

癌症丛集(cancer clusters)这种现象非常有名,从这种现象的研究,可以进一步说明上述的道理。假设随机掷出16支飞镖到一个正方形,它们插中正方形中任何一个地方的概率相同。现在把这个正方形分成16个更小的正方形。这么一来,我们预期每个小正方形平均会有一支飞镖在上面——但这只是平均值而已。16支飞镖恰好分别插中16个不同的正方形,这样的概率非常低。比较常见的结果是,一些正方形里面会有一支以上的飞镖,许多正方形则一支飞镖也没有。这些格子如果不出现(癌症)丛集,将是极为罕见的事。现在,把插有飞镖的格子覆盖在任何地区的地图上,一些报纸就会宣称其中某个地方(飞镖数高于平均值者)的辐射线太强,造成癌症病例显著增多,因而促使律师开始去找癌症患者,准备索赔。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈