别说你懂统计学MOBI,EPUB,AZW,PDF,TXT,KINDLE
作者: (英) 安东尼·鲁本
出版社: 中信出版社
译者: 胡小锐
出版年: 2020-10-1
页数: 215
别说你懂统计学
要知道你到底在说什么
已故统计天才汉斯·罗斯林(Hans Rosling,1948—2017)指出,在瑞典生活的人平均拥有不到2条腿。所有人的腿都不超过2条,少数人少于2条,所以平均之后略低于2条。这就意味着几乎每个瑞典人(实际上全世界所有人几乎都是如此)的腿数都高于平均水平。这个平均数根本不可能真实反映瑞典的情况。
上面这个例子很好地说明了关于平均数的一个问题:尽管计算是正确的,但得出的平均数毫无意义,因为它忽略了数字代表的含义,而且得出的平均数无法说明数据集中那些真实的人的任何特征。
本章将讨论平均数,以及如何利用平均数深入理解一组数据或者让它变得难以理解。我们将发现平均数非常有用,具有某种代表性,但它不一定就是某个范围的中点,未必能帮助我们全面掌握所有数据的特点。这种方法通过一个数字告诉我们关于整个数据集的某些有用信息,但它可能无法体现其中的极端情况以及数字的分散性。然而,新闻中一直在使用平均数,而且通常情况下没有人提出质疑。本章涉及很多数字,但不用担心——所有计算都非常容易。本章将讨论以下内容:
•如何计算算术平均数、中位数和众数;
•平均数表示方法的选择所导致的误导性;
•范围的度量。
如何计算算术平均数、中位数和众数
你可能会遇到三种表示平均数(average)的方法:算术平均数(mean)、中位数(median)和众数(mode)。算术平均数就是把所有数加起来,除以数的个数后得到的值。举个例子。假设你是一名板球运动员。在赛季结束时,如果你想知道你在本赛季的平均得分,就可以把你的攻方得分相加,然后除以你击球的次数。(是的,板球爱好者,我知道你们需要考虑自己“不出局”的次数,但任何见过我击球的人都会知道,为什么我不太关心这个问题。)当人们提到平均数时,通常指的是算术平均数。
中位数是中间的数。假设一个班级有29人。为了求出他们考试成绩的中位数,你把他们的成绩按顺序排列,那么第15名的成绩就是你要的答案。如果班上有30名学生,中位数就是第15名和第16名的成绩的中间值。
众数很少使用,但偶尔也会发挥作用——众数就是出现频率最高的那个数字。如果你想知道法国职业足球运动员年龄的众数,就要找出哪个年龄的球员最多。如果你调查的是人们上班时使用的交通方式,众数就是非常有用的数据了,因为它告诉你的是使用哪种交通方式的人最多。