事先声明一下,“明人”在此文中是指视力能支持其正常生活的人,与盲人相对。这个“象”不是真正的大象,而是我们要了解的事物或世界的真相。我们经常用“盲人摸象”来比喻人们对事物的了解不全而固执己见,从而产生争执,以此说明事实往往由于各人角度的不同而付以不同的解释。这个典故据说是取自《涅槃经》或《长阿含经》,大概起源于印度,故事中的五个摸象的男人是盲人。据说波斯版本故事中的五个男人都是视力正常,只不过在黑暗里摸象,直至灯亮了,五人才能见到大象的真面目。
然而在现实生活中,我们所要了解的事物往往不是像大象那样可以全部被囊括在我们的视野中,从而让我们可以了解事物的全面。因此我们对事物的了解,或者说,获得的信息,在许多方面是局部的,甚至是碎片式的。那么我们是否会由此得出结论说,因为我们无法毫无遗漏地获取所有的信息或了解事物各方面,所以我们就无法正确了解事物?当然不是!演绎法,归纳法,逻辑推论,实验证明等等是人类了解世界,并让文明不断进步的手段。也应当承认,大数据的发展也确实让我们全面了解世界的能力更近一步,只是大数据也是通过相对有限的数据做出较全面的结论。在其过程中,统计学的应用是不可缺的,当然我不是这方面的专家,也无意在此讨论。只是在日常生活中,以统计学的一些概念或原理来引导我们分析获得的信息,将会帮助我们比较全面或正确地了解事物。
在我们的日常生活中,我们经常比较不同的事物或信息从而做出选择或决定,无论是购物,股票交易,子女教育,求职等等,从比较中追求利益最大化,从而达到心理上的满足。在涉及公共管理,也就是政治,特别是选举,那更是比较又比较。在华人圈里,中美之间的比较,更是像烧热的油锅,碰上一丁点的水(话题)就劈里啪啦地炸开。不少人经常由此导致友情,同学情,甚至亲情破裂,严重的话估计还有肢体冲突,大打出手。
如果有些统计学的知识,那么相信无论个人在分析判断做选择或与他人讨论时会了解自己或对方可能犯了统计学上的哪些错误,明白应该如何获得更具有代表性的信息从而更全面地了解自己和对方,以及应该如何比较科学地分析问题。那在应用统计学的知识来做分析和比较时,我们应该注意那些要点呢?
首先,样本(sample)的代表性(representative)。统计学上,样本是指从全体中随机抽取的个体。如果抽取的方式和数量不合适,那么样本的代表性就可能有偏差(bias),影响由此通过统计学分析得出的结论。在现实生活中,我们当然无法像统计学专家那样设计一个方法去获得所谓的具有代表性的信息(样本),但是我们可以有意识地减少偏差,比如,我们有意识地看不同来源的信息。只是随着大科技公司的垄断越来越厉害,加上他们使用算法根据个人的阅读习惯而推送类似的信息,我们的信息来源很容易比较单一。我们要摆脱这种思维壁垒会越来越难,因为我们是在和我们自己大脑的运作习惯做斗争,大脑的这种倾向简单省事(从而节省大脑运作时消耗的能量)的运作习惯是人类进化的结果,因此我们有意识地阅读不同来源或观点的信息时会比较痛苦,因为大脑要运作起来。另外,还有心理上的因素,就是自己会有意无意过滤对所归属(或所偏向)组织有负面影响的信息,比如,到了国外还是依赖微信,看国内的电视,阅读亲中的中文报纸(这种心理因素就不是这儿讨论的话题)。因此,即使在资讯能比较自由获得的地方(社会),许多人的信息还是有许多偏差,更不用说生活在实施金盾工程里的墙内民众了。那种极端偏差是统治者有意识地做,因为对他们的统治有利,比如,对坏消息的控制报道,这实际就是数据操纵(data manipulate)。对某类数据(坏消息相当于负数据,如果把好消息当作正数据的话)的选择性使用,将会导致分析结果产生偏差,决策错误,误国误民。好比在临床实验中,把不好的结果选择地报告和分析,导致本来是不好的药,经过这种数据处理,被“科学“地证明是好药。这种现象在统计学(或者计算机领域)上就是:garbage in, garbage out(垃圾进,垃圾出)。需要提醒的是,在自由社会里,大科技公司已经部分承担统治者的这种角色,因此民众也要非常警惕,否则我们也会掉入同样的陷阱中。
其次,数据的量化(quantitative)。在自然科学的比较研究中相对容易些,因为数据基本是量化的,但在社会科学的比较研究中相对可能难一些,因为有些数据或信息是比较难量化的,或者或量化值是相对值,比如,痛苦指数1到10,你的5可能是别人的8。大学的排名是另外一个例子,如何说明一个学校好或不好,有些参数是比较主观,因此大学排名大多选择一些比较可以量化的,比如,论文数量、校友捐款数量、毕业生工资水平,等等。非常可惜的是,我们经常讨论的或争论的话题,往往更难量化,比如,哪个政治制度更好,哪个候选人更好。这种情况下,往往是智者见智,仁者见仁。
第三,数据的分析(data analysis)。在统计学上有各种数理统计的分析方法来比较两组数据,比如,从两台仪器得出的数据,临床实验中两组病人的数据,或者产品销售的数据。根据不同的数据特点,不同的实验设计,采取相应的分析工具,从而的出比较有说服性的结论或做出比较客观的决策。在数据的分析过程中当然有些潜在的问题,比如,数据是否会被自动地选择性使用,分析工具中的模型参数是否可能会根据需要而人为地改变。另外,统计学也会被误用,比如,统计学里有句话:Correlation is not causation (有相关性比非有因果关系),就是说在某个时期内,两个变量参数之间存在关联,但是这两个参数之间没有任何因果关系。举个例子,如果我们收集美国国内每个月冰淇淋的销售量和每个月鲨鱼攻击人的次数,我们会看到这两个参数高度关联,但是他们之间没有因果关系。如何解释这种现象呢?比较容易接受的解释是当天气越暖和时,更多的人会去买冰淇淋和到海里嬉水,到海里的人多那受到鲨鱼的攻击就多了,因此两者之间有关联但却无因果关系,也就是不能说多吃冰淇淋会导致鲨鱼攻击。这种现象在日常生活中也经常无意识地误导我们,从指导日常饮食到阴谋论,在此我就不展开讨论了。在现实生活中,我们无法对任何事物的比较采取这么正式的、严格的统计学分析,基本是根据个人经验和掌握的有限信息在短时间内通过大脑的适当推理做出判断,大多数就是所谓的直觉。只是在一些重要决定上,比如买房,可能会稍花点时间考虑多些参数,收集更多的信息,再有不同的参与者讨论。这种讨论实际相当于数据分析模型中参数(比如,购房时对朝向、面积、地理位置等的考虑)及其权重(哪个参数比较重要)的选择,不同的人因对此有不同的选择从而有不同的结论和决定,
下面就举些例子来说明问题。
第一个是历史上“田忌赛马”的故事,这是一个操纵统计分析的实际例子。比赛双方的上、中、下等马相当于一个样品的极端简单化的正态分布,理论上应该是各方用属于正态分布的同一部分来比较,从而达到合理的分析结果,而田忌人为地改变数据的匹配,导致得出相反的分析结论。表面上看田忌赢了,但他的马队整体实力其实不如别人,到了真正打起仗来就会表现出来了。这种误人子弟的思想却被国人当作如何善用自己的长处去对付对手短处的教育材料,该是反思和改变的时候了。
第二个是有人以国内某个城市实验在地铁口放一堆硬币,上面写着供有需要(零钱搭地铁)的人自行取用,从实验结果来说明这个城市的人民(甚至推广到中国人)是如何文明。有人在视频下留言说在纽约市地铁试试并给出预测结果,从而预测美国人的素质比中国人差。实际上这种实验更多的是心理实验,有特定的实验设计(比如环境、用词)和目的,不应该(也很难)从中推出其他一般性(比如国民素质)的结论。国民素质是一个需要不同参数来衡量,而不是一个或少数参数就可以得出结论。如何选择有意义的参数,如何定量化,都是需要讨论,假设和论证。我们也看过视频显示国内有人哄抢免费的食物以及货车翻倒散落的货物,这种无实验设计的事件,倒是更有代表性,或者说,统计学的意义,虽然不是很完善。另外一个现象,就是见到别人摔倒(特别是老人)而不敢扶,可能更说明社会某一问题。
第三个问题是涉及种族问题,在目前政治正确越来越狂热的环境下,更难进行科学讨论,虽然那个非常强调政治正确的党派自称非常讲“科学”,他们有人甚至说攻击他就是攻击“科学“。近期发生的黑命贵运动让人想起income inequality(收入不平等),自然就扯上智商、暴力、种族主义等话题。如果用统计学的方法,也就是大数据,加上生物学的研究,应该可以逐步得出一些结论,只是这些结论可能会引起争议,属于政治不正确。当然,大数据的结果会告诉民众某些现象与种族之间的关系(关联性),但可能没有因果,或者说因果关系尚无法解释,比如,如何从生物学的角度定义种族(race),如何更科学地量化智商和暴力行为。更进一步说,基因上哪些片段决定种族,哪些片段决定智商,暴力行为,大数据是否能分析出结论?这可能是从根本上回答上述问题的方法,但在这种知识获得之前(能否得到允许去做实验来获得也是一个大问题),我们也只能尽量用比较宽容的态度对待这种问题,不要轻易做出任何结论。
第四个问题是当前热点话题,那就是中美之间防疫措施的比较。这是一个各方都可以拿来诋毁对方,抬高自己的话题。美国这儿说中国数据造假,清零政策没有人性,产生的负面作用更大,损失更高。中国那儿说他们控制的好,美国一塌糊涂,不顾人民死活,还是中国政府的管理方式好。从这种谁说都对的结论中,可以看出在比较中没有正确使用统计学的常识。首先,双方使用的数据不是相同性质的数据(sample),双方数据的真实性都有待商榷,美国这儿相对比较真实,但死亡率往高的报可能性比较大(这儿就不展开讨论),中国那儿就相反,瞒报和选择性地报(对如何定义因新冠死亡和美国不同)的可能性大,无论从目的和手段,以及过去的劣行,都无法避免这种现实。其次,参数的选择和量化没有统一,也就是说,选择哪些参数并量化这些参数,两国是各说各的,中国基本就以感染率和死亡率为参数来评估防疫措施的好坏,同时又操纵这两种数据,因此很容易让墙内民众相信并崇拜政府的能力,直到亲身体验严酷防疫措施造成的伤害才又可能明白。哪些次生灾害需要包括进去考虑?经济损失如何计算?长期的隐形影响?比如,封城导致生育愿望的下降最终出生率下降而对经济的影响呢?很现实的例子,西安的封城已经导致两位孕妇流产。当然,会有人说怎么证明这与封城有关?没封城也会有人流产。这种问题是无法回答,因为你无法同时做相同条件的实验来证明,不过也许通过历史数据及将来的数据(出生率)可以得到一些答案。因为双方使用不同性质的数据,不同的模型分析数据,自然就得出不同的结论,就看你对哪些数据更相信,认为哪些参数需要考虑和其权重如何。从本人的角度来讲,人是要生存,如果防疫措施导致整个社会失去的人(现在和将来的人)更多,无论是因病毒、次生灾害(其他疾病无法医治)、或者经济(贫穷或饥饿)致死,那么这种防疫措施就不是好的措施。
最后一个是疫苗的问题。假设疫苗的审批过程中是严格按照现有的标准和程序来经行,理论上疫苗的有效性和副作用是得到比较全面的评估。在这过程中,统计学一定得到重要的应用,因此,我们是可以相信疫苗在统计学上是有显著的作用。但是,有用不表明一定要利用行政手段强行要求每个人都打(申明一些,本人打了两针辉瑞疫苗),如果要强行打,必须经过相关行政或立法程序来实现,不可上升到道德或政治正确的层面。有人可能会用人类如何通过疫苗消灭天花,现行疫苗的使用,以及强调不打疫苗对医疗系统产生不负责的崩溃压力,来为强行打疫苗辩解。这里不便就此开展讨论,因为需要专业知识和一定的篇幅来讨论。只是希望同样使用上述的建议来进行比较,从而得出比较合理的结论。这儿提出几个问题供思考:天花是否也像新冠一样容易变异?今后如果有其他流行病是否也要如此?比如流感?如何能量化对医疗系统的影响?选择什么参数?传染率?致死率?民众的恐慌心理是否也是参数之一?为什么会恐慌?疫苗的长期副作用呢?除此之外,许多人做出的结论是根据个案,因此婆说婆有理,公说公有理。有的人除了考虑健康,还考虑对个人权利的影响,比如,新罕布什尔州的车牌上就印着“Live Free or Die”(宁死也要自由)。从风险控制的角度,适当让一部分人不接受疫苗也是防止假如疫苗有未知问题(毕竟临床实验事件较短)导致人类的大规模灾难。另外,虽然从统计学的角度,疫苗是有显著的益处,但对个体来说,无论哪种选择导致的结果发生,一旦发生,发生的概率是百分之百。这个个体无法同时又起死回生,做另外一个选择,看结果如何,而且这个个体需要死去好几百回,才可能有统计学的意义显示哪个选择是对的。死亡率不同的两个选择,在只发生一次的情况下,从统计学的角度,不能肯定死亡率高的那个选项会让此人死。
总结地说,在日常生活中有意识地学习和应用统计学的一些基本原理,对事物的了解相对会更全面和合理,会做出比较正确的选择,同别人交流时也可能会更有说服力,也同时不太会轻易相信所谓专家、国师、政委之类人物的权威论述,也许因此生活会比较和谐、愉快。
作者投稿