平日我们经常在工作中用数字来支持自己的结论,经常因为不够严谨而漏洞百出。在《科学推理》这本书在针对统计推理的介绍中总结了数据应用的谬误,希望自己能时刻注意。
平均数谬误
三个统计学家去打猎,碰上一头大鹿,第一个人开火,结果偏左一米,第二个人开火结果偏右一米。第三个人放下枪欢呼胜利“平均而言我们大众了!”,事实上平均打中了,但一点意义都没有。
《黑天鹅》里塔勒布把世界分为两种:一种叫平均斯坦,一种叫极端斯坦。在极端斯坦的世界里讲平均数就是个笑话,比如包含比尔盖兹的一群人里计算个人财富,得出大家平均财富超高的结论是没有意义的。
绝对数字陷阱
某校今年本科生上线达500人,比去年多了50人,所以喜获丰收
绝对数字要跟相对数字结合才比较有说服力。
百分比陷阱
肺结核发病正在迅速增长,今年肺结核数量增长的比率是去年的4倍。
比率是四倍不意味着人数是四倍。
赌徒谬误
一对农村夫妇,特别想要一个男孩,生了第一个孩子是女儿,叫招弟;第二个是女儿,叫跟弟;第三个还是女儿叫听弟;第四个还是女儿叫等弟;第五个到第七个还是女儿,分别叫候弟,盼弟,望弟;一个七个女儿就是没有男孩。其实不管生几个女儿,下一个生儿女的概率各是50%。
数字和结论不相关
近十年里来,德克萨市州博士的数量每年增加5.5%,而该州骡子的数量每年减少5.5%,所以博士数量额增长导致了骡子数量的下降。
在《因果关系》中将这种关系定义为为叉结构: 博士数量增长 <— 城市化进程 —> 骡子的数量下降
数据不可比
今年本公司的汽车销售了10万辆,是竞争对手公司的一倍,我们的好年头来了。
统计表明,大多数医疗事故出在大医院,因此去小医院看病比较安全。
独立数据
某国卫生部门统计,2004年全国糖尿病患者中70%为肥胖者。这说明,肥胖将极大地增加患糖尿病的危险。
实际上很可能全国的肥胖者比率就是70%,跟糖尿病没事哈关系。