《How to Lie with Statistics》是一本于1954年出版的统计学书籍。它全面介绍了各种常见的统计类型,包括样本研究、制表方法、访谈技巧以及从数字中得出结果的方式,并揭示了许多回避方法,使统计结果被用来愚弄而不是告知。该书的作者Darrell Huff是一位美国作家,他于1913年出生于爱荷华州的Gowrie,并于2001年去世。Huff曾就读于爱荷华大学,并以《How to Lie with Statistics》在二十世纪下半叶成为最畅销的统计书之一。
该书的章节包括:样本内置偏差、精心选择的平均数、隐形数据、虚无的大惊小怪、炫酷的图表、一维图像、半附着的数字、事后推论、如何虚构统计等等。
在现实生活中,我们对数据的重要性越来越深刻地认识到,特别是在毕业和求职的准备过程中。在撰写简历时,常常会建议我们尽可能地使用具体的数字来描述经验和成就,以增加说服力。然而,我们需要怀疑我们在日常生活中接触到的数据是否真实反映了实际情况。平均数是一种常见但具有欺骗性的统计数据。尽管我们可能知道平均数并不能展示样本之间的实际差异,但在呈现数据时,我们仍然可以通过各种手段"美化"这些数字。例如,设计图表或巧妙调整坐标轴,以减弱不太理想的数字的显著性。数据看似客观,但背后的收集和呈现方式可能充满了主观性和操纵性。因此,我们需要警惕数据可能隐藏的陷阱和误导,并学会更加理智和批判地看待各种数据和统计结果。
了解一个事物的全貌最准确的方法理论上是逐个了解其每个个体。然而,在现实生活中,由于样本数据的庞大,我们常常采用抽样的方法。不同的抽样方法会导致不同的结果,这一点在日常生活和职业生涯中尤为明显。以求职为例,当我们试图通过内推找到一份工作时,我们可能要从数千甚至数万名员工中选择一个人联系并请求内推。这个过程与抽样非常相似。联系的人数越多,我们获得想要结果的可能性就越大。这就是基数的力量:在抽样时,我们选择抽取整体的1%、2%还是10%抽样,抽取的数量越多,我们获得有用信息的可能性就越大。然而,抽样的质量同样重要。在寻找内推的过程中,我们选择一个与自己毫无关联的陌生人还是来自相同学校或国家的人,通常找一个与自己有共同点的人进行内推的成功概率更大。这一点在抽样中同样适用:在增加抽样样本的同时,我们需要有勇于尝试且不怕被拒绝的精神。在选择抽样对象时,我们需要谨慎挑选并仔细考虑,以确保抽样的质量和效果。
在我的本科学习期间,我参加了一门名为"批判性思维"的课程。这门课程讨论了一个核心问题:当我们接收到某个消息或论述时,我们应该如何验证其真实性。我们需要检查信息的来源,评估来源的可信度,并进一步探讨,如果论述基于某个事实,是否存在其他不同的解释方式。讨论"数据会说谎"这个主题时,我们实际上需要运用批判性思维来审视问题。我们应该问:这些数据由谁提供?它们是发布在一个有公信力的学术期刊或会议上?还是仅仅是某个个体在网络上的随意发言?如果这个论断发表在一个我们不熟悉的会议、期刊或官方线上社区中,我们需要进一步研究和验证该社区的公信力。此外,即使前两个问题的答案都令人满意,我们还需要考虑第三个问题:这些数据是否存在其他可能的解释。以书中给出的一个例子为例,关于1924年毕业的耶鲁学生人均收入为25,000美元的数据,我们需要问:这是否真的代表了所有的毕业生?即使是被统计在内的毕业生,这个数据是否真实反映了他们的情况?科学的态度是持续的怀疑和验证。我们需要不断检查和我们倾向于接近那些与自己相似的人,我们在做决策时所依赖的过程和结论很可能基于我们自己的经验、我们熟悉的生活环境,或者与我们相似的人群。如果我们不跳出自己熟悉的背景,不去探寻新的思想和观点,这种隐性的偏见可能就会一直存在。在微软文化中,强调"成长型思维"是非常重要的,其中一个核心理解就是要拥抱与自己不同的观点。面对不同的观点时,认真考虑的能力至关重要,同时,找到这些不同观点的来源也同样关键。当我们生活在自己的环境中时,如何找到不同的观点?如何跳出自己的舒适区?在有机会的情况下,多听取一些与自己背景迥然不同的人的建议,可能是获取新样本来源的一次机会。虽然我们无法保证这些新样本一定是好的,但至少它们增加了样本的多样性,就像自然环境中的生物多样性一样。
相关推荐
© 2023-2025 百科书库. All Rights Reserved.
发表评价