技术先进、易学易用、高投资回报的酒店 餐饮、会展等收益最大化专业服务平台

自主创新和研发适合中国市场的本地化、接地气、实用、高效的收益管理软件,并提供专业、高素质的培训、咨询等支持和服务。

统计学告诉你怎样编故事

2016-08-08 admin 访问量:3061次

人是善于给自己编故事的动物。哪怕是毫无意义,随机的现象,人也能够编出一个逻辑,头头是道的讲出一个听起来很有说服力的理论或者道理出来。从以前的夜观星象,到现在的股票分析师,语文课本里的中心思想。。。往往摆脱不了这种人内心的本能。要想更清楚的认知这个世界,还是要学一点简单的统计学。



         二战晚期,困兽犹斗的德国发明了V-1 “飞行炸弹”,也就是现在导弹的前身。在1944年,德国从当时欧洲大陆的德占区往伦敦发射了数千发这样的飞行炸弹。 英国政府对伦敦内V-1的落点和数量做了详细的统计。

         一个自然的问题就是,这些V-1到底有多精确?德国工程师有没有达到“指哪打哪”的技术呢?当时的一位英国统计学家Clarke就此写了一篇论文 An Application of the Poisson Distribution / 一个对泊松分布的应用。

         Clarke 取样了伦敦南部一段饱受V-1轰炸的地段,将其如棋盘一样,划分成24x24共576个相同大小的方块,并统计了每个方块内被轰炸的次数。得到如下一个表格。



         结论是,其中大部分的方块都没有被炸,但是有8个方块被轰炸了4次或者以上。这是否说明德国人是有目标的轰炸,并且能够准确的把V-1引导到目标呢?这里我们要了解一个统计学上的概念叫做泊松分布啦。



       泊松 (Poisson) 是位19世纪法国科学家。泊松分布即是命名于他。这个分布是用来描述和建模在固定时间(或空间)某事件发生次数的概率,条件是该事件的平均发生率已知,并且下次发生是独立于距最近一次发生的时间。这个定义有点绕口,我们看看一些例子吧。

        你收到 email 的数量,大概就是能够被泊松分布所描述的。假设你平均每天接收10封电子邮件。但是肯定有的天中,你收的邮件原不止10,有的时候又远小于10。但是我们只要知道你平均每天接受10封邮件,我们就能够算出你在一天中接收11、12、13、14,或者任何数量邮件的概率是多少。


泊松分布严格的数学上的定义是以下公式给出的:



其中 λ 是事件发生的平均次数。泊松分布的一个惊人的(对我来说)特点是,这个分布只有 λ 一个数就能够定义了。常见的正态分布,则需要两个变量才能够定义。

在V-1轰炸伦敦的例子中,576个方格中,被炸总数是577,也就是平均被炸率是1点几。下表是假设V-1的落点服从泊松分布的话(也就说德国人没有能够做到指哪打哪),和实际情况对比。



大家可以看到,两列假设泊松分布推算的数据和实际数据惊人吻合。虽然看来V-1的落点是高度聚集在一些方格中,但数学告诉我们,这实际上是服从一个随机、独立事件的分布规律的。

泊松分布是一个非常常见和常用的分布。如果你能够看了本文,对泊松分布,甚至统计学有了兴趣,那我非常高兴。但是即时这件事没有发生,这篇文章还想表达的是,人类仅仅凭直觉是很难判断什么是随机现象,什么是有规律的。看来有规律的情况,比如伦敦被炸,其实经过分析,只是随机现象。

人类的思维有一个系统误差,就是更容易把随机的事情看成其背后是有规律,有故事,有原因的。星象,指纹,股票的跌涨。不确定的时候,更保险的做法是假设随机,而不是自信你看到了什么微妙的规律。有时候那姑娘多看你几眼,真的只是个随机事件,不要想多了。

PS   写完了又想起一个事情来补充。有时候,人类这种“无中生有”,在random 中看出故事的能力,也带来了可观的创造。我想起的是乔布斯2005年在Stanford毕业典礼上的致辞。当时老乔鼓励同学说,你们大胆去做自己想做的事情,不要担心以后没用。他举例自己大学辍学后,学书法,最后居然用在了第一台苹果电脑的设计上,以此说明,实现无法预料,但是事后总是能够用得上。


英文有句话说 life must be lived forward, but can only be understood backwards. 人的一生,一路活下来感觉很随机。到中了之时,回头看看,却能看出一条主线,冥冥中自有天意。这可能不是真的有天意,而是人性自能在无序中看到有序,在无意义中看到真谛。

上文转自数学中国

评论