智商测试:是科学还是偏见?

智力如何被一步步抽象为独立实体?又如何被量化为具体数字?接着又怎样为鼓吹基因决定论和种族优劣说的人们所利用?

按:如今,当人们形容一个天才,总不可避免诉诸于“智商”(IQ)。诸如智商148及以上方能加入门萨俱乐部、天才少女智商超越爱因斯坦此类传闻比比皆是。智商,成为了衡量一个人聪明与否的理所当然的标准。但智商是如何诞生的呢?它的测量标准就是绝对正确的吗?它和基因遗传论、与美国如影随形的种族主义又有何种牵连?

著名进化论科学家、古生物学家斯蒂芬·杰伊·古尔德的《人类的误测:智商歧视的科学史》一书,将为我们逐一解开上述谜团。简言之,这本书是关于智力如何被一步步抽象为独立实体,又如何被量化为具体数字,接着又怎样为鼓吹基因决定论和种族优劣说的人们所利用的。

回想历史上曾多次出现的基于生物决定论的排外政策,回想《美国移民限制法案》签订时美国总统说的那句“美国,必须保持是美国人的美国”,再看看如今某些国家和地区对待难民及外来人口的态度,想想那句“让美国再次伟大”,这本写于1981年的书,现在读来就绝不过时。

前进化论时代的颅骨测量

1846年,阿加西斯在一封寄给母亲的信中,写到在费城参观科学家、内科医生塞缪尔·乔治·莫顿解剖藏品的情况:“那里排列着600个头骨,多数是印第安人的,它们来自于居住在美国或者曾经在美国居住的几乎所有印第安人部落。没有其他任何地方有这样的藏品。就凭这些收藏,我的美国之行也值得了。”

莫顿颅骨收藏中的其中一件,图片来自美国哲学学会
莫顿颅骨收藏中的其中一件,图片来自美国哲学学会

从阿加西斯热情洋溢的笔触和毫不吝惜的溢美之词,能看出这次会面对于他的重要性。毕竟,这是美国人种多元发生学两位代表人物的一次历史性会面。

何为人种多元发生学?让我们回到进化论未盛行之前,由创世论统领的19世纪。

那时的普遍共识是:人类的不同种族有等级之分,通常认为,印第安人低于白人,而黑人低于所有人。在这个共识基础上有两派,“强硬派”认为黑人天生低劣,而“折中派”则认为适当的教育和得体的生活能够把黑人提升到白人的层次。

在种族等级的前提之下,也存在两种模式。一种是遵循《圣经》创世纪的观点,认为从上帝创造亚当和夏娃之时,人类就是同根同源的。也就是说,人类作为一个物种,是伊甸园堕落的产物,其中白种人退化的少,黑人退化的最多。这被称为“单元发生学”。与之相对的是“多元发生学”,它的拥护者抛弃了《圣经》的寓言,认为人类种族是相互分离的物种,不同亚当的后代,因此黑人无须被纳入“人类平等”的范畴。

回到那次历史性的会面。其中的一方是瑞士自然学家路易斯·阿加西斯(1807-1873),大名鼎鼎的居维叶的学生。他在19世纪40年代移居美国后,在费城生平第一次见到黑人。“看到他们黑色面孔上厚厚的嘴唇和古怪的牙齿,脑袋上羊毛一样的头发,弯曲的膝盖,拉长的手臂,硕大而弯曲的指甲,尤其是他们青灰色的手掌心,我甚至无法把视线从他们脸上移开,以告诉他们离我们远点。”

与黑人的令人心生厌恶这次照面,更加坚定了阿加西斯作为哲学家的责任:“地球上有许多不同人种,他们住在不同地方,身体特征各异,这个事实……使我们有义务用一种科学观点确定这些种族相对应的级别,不同种族特征的价值。”同时,阿加西斯认为,黑人处在任何客观等级的最底层。

路易斯·阿加西斯

而会面的另一方,塞缪尔·乔治·莫顿则从单纯的理论过渡到实验。那个令阿加西斯叹为观止的头骨收藏,构成了他多元发生学说的主要试验场。

莫顿对于颅骨的兴趣生发于1830年为《五个种族的人类展览中的不同形式的头骨》的演讲做准备时。莫顿打算沿用德国人类学家约翰·弗里德里希·布鲁门巴赫(1752-1840)采用比较解剖学确立的人种的五个分类(蒙古人种、尼格罗人种、高加索人种、马来人种、印第安人种)来进行讲解,但是他很快意识到没有足够的例子来解释各个种族。这次事件成为了莫顿终其一生收藏来自世界各地的颅骨的愿望的催化剂。

1832年,他给一位科学家同事写信,在信中初次表达了想获取不同种族的人颅骨的愿望。一年之后,莫顿在信中提到,他的颅骨收藏已经达到了将近100件,其中包括了说不同母语的人。

很快莫顿的收藏就成为了世界上最大的收藏,并且在科学圈子被称作“美国的各各答”。在世界偏远地区驻扎的军队外科手术医生不惜冒险为莫顿收集颅骨,为了获得颅骨,有些人甚至去盗墓。

莫顿世界范围内的联系人多达138位,从科学家到商人,从军事人物到传教士。正如威廉·斯坦顿所言:“他广泛的科学联系,特别是和在偏远前线驻扎的军医,把每一个州、每一寸领土以及每一个国家的颅骨都送到他面前。”

塞缪尔·乔治·莫顿

莫顿将这些收集来的头骨投入到实验中,他的前提假设是:种族的地位可以通过大脑的物理特征,特别是大小,客观地确立。因此,他在头骨颅腔中填满经过筛选的白色芥末种子,间接测量颅骨的脑容量,接着,利用不同物种的平均容积来划分种族等级,脑容量越大,种族等级越高。

在这些颅骨收藏和他的颅腔容量实验的支持下,莫顿先后出版了三本著作:1839年的《美国人的头盖骨》(这里的美国人指美国印第安人)、1844年的《埃及人的头盖骨》以及1849年的全集摘要。数据显示,按照颅腔容量从大到小排列,依次是高加索人、蒙古人、马来人、美国人和埃塞俄比亚人。

1854年诺特和格利登合著的《人类的类型》插图

根据头骨和长相便能确定罪犯?

1859年,达尔文的《物种起源》出版,创世论逐渐淡出历史舞台。进化论与量化的科学潮流一起,造就了“科学”种族主义理论的诞生。达尔文的表兄弗朗西斯·高尔顿和法国医学系临床外科教授保罗·布洛卡都成为了颅骨测量法的信徒。

进化论的另一个“贡献”,在于把空间上的差异转化为时间上的先后顺序。“重演理论”开始流行。对于希望把人类种群按照高低优劣进行排列的科学家而言,进化论成为了绝佳的思想武器。一种根据整个身体结构,而非仅仅依据大脑质量的种族排序生理学理论就此诞生。此后,所有低等群体都被拿来和白人男性儿童进行比较。

1890年,美国人类学家布林顿曾对这种测量理论进行评价:“为了建立人种的比较解剖学,人体的所有部分几乎都已经被细致地扫描、测量、称重过了。”

除了种族因素,性别和阶层的加入都让这一图景变得更加混乱和复杂。这不得不提到人体测量学传统最具影响力学说犯罪人类学的代表人物,意大利医生隆布罗索。

隆布罗索

1870年的一个清晨,在隆布罗索检查著名强盗维希拉的头盖骨时,他声称:“一看到那个头盖骨,我似乎突然间看到了罪犯本性中的问题,就像火红天空下一片无垠的草原被点燃了一样——一个返祖的生物,在自身内部复制了原始人种和低等动物的残忍本能。”这也就意味着,犯罪分子和野蛮人一样,是人群中的进化返祖者。

隆布罗索测量罪犯的工具

为了完成这一论述,隆布罗索进行了如下几步论证。首先,他强调动物身上具有的犯罪行为,比如蚂蚁在愤怒的驱使下杀死昆虫,比如海狸集合起来构成犯罪团伙劫杀落单的同类等等。接着他将罪犯与“低等”群体进行对比,把犯罪视为低等群体的正常行为。在一篇关于尼罗河上游丁卡族的文章中,隆布罗索谈到他们身上的大量纹身,认为这反映了他们迟钝的痛感以及对于纹饰返祖性的热爱。而“他们的鼻子……不仅是扁平的,而且是三叶的,就像猴子一样。”更进一步,隆布罗索认为孩子是天生的罪犯,因为他们是祖先的成年形态,活生生的原始人。

在这一系列链条式的推导后,隆布罗索开始在罪犯身上寻找基于遗传学原理的原始性状。他列举了类猿的特征:更厚的头盖骨、更简洁的颅缝、过早出现的皱纹、低窄的额头、大耳朵、较少出现的秃顶、较黑的皮肤、更高的视觉敏感度、较弱的疼痛感以及血管反应(脸红)的缺乏等等。

隆布罗索的罪犯类型学

隆布罗索的理论在当时造成了巨大影响,在先天遗传和后天环境对于罪犯的影响而言,隆布罗索毫不犹豫地支持前者:罪犯是天生的,而非后天养成的。

他也把这一套生物决定论运用在具体的案件中。在隆布罗索应邀协助裁定的一起继子杀母案中,他判定其中一个继子有罪,理由是他“简直是天生罪犯中最完美的类型:大嘴巴、前额凹陷、颧骨突起上嘴唇较薄、大门牙、异乎寻常的大脑袋、感觉迟钝,而且习惯用左手。因此他被证明有罪。”

智商作为划分种族和阶层的依据?

1898年,巴黎大学心理学研究室主任阿尔弗雷德·比奈(1857-1911)决定研究智商测量。他顺理成章地遵循前人之脚印,认为智力和脑容量之间确实存在正相关。但在不同学校展开的针对儿童的头部测量得到的数据来看,比奈承认“通过测量头部而衡量智商的方法似乎是荒谬的……我打算放弃这项工作,也不想再发表任何有关的东西。”

1904年,比奈重操旧业。介于之前的打击,他决定放弃颅骨测量法,转向心理学。他汇集了一系列与日常生活相关的简单任务,在专人指导下,让孩子们完成,并按照难易程度进行评分。1908年比奈量表的版本建立了我们现在所说的IQ测量标准。

和前人相似,先天和后天的问题在比奈这里也居于核心地位。比奈曾表示:“我们只想测试智力本身,并在这个范围内尽可能忽略孩子所受的训练程度……我们不让他读,不让他写,不让他做任何通过死记硬背就能顺利完成的测试。”

与此同时,比奈认为智力是个复杂的概念,不是仅凭一个数字就能说清楚的。这个后来被称作IQ的东西,只是基于有限实用的目的被创造出来的,是粗略的、经验的。在这里,比奈站在了反遗传论的阵营,他所研发的智商测试,实际上是一个通过恰当教育提高潜能的理论。同时,智力绝非一个固定不变的先天量值,它是可以通过良好的教育得到提高的。

比奈的初心在美国遭到了IQ遗传理论倡导者的曲解,他们认为智力在很大程度上是遗传的,并且提出了一系列混淆文化差异和先天属性的论证方式。在他们眼中,IQ分数标志着人种和种群必然应处的社会阶层。

阿尔弗雷德·比奈

作为第一个在美国普及比奈量表的人,戈达德却将比奈量表的测试结果视作对天生、单一实体的测量。他的主要目的是通过辨识而认定界限,隔离群体,阻止处于危险境地的美国血统继续恶化,同时他也主张剥夺外来移民的生育权。以比奈量表测量出的智力结果为桥梁,戈达德开始用智力差异来解释许多社会现象,并且把智力缺陷和道德缺失联系起来。

基于智力会遗传的这一前提假设,满腔热情的改革派戈达德顺理成章的走向了优生学。他提出两条建议:第一,不允许本地智力低下者(即戈达德口中的傻瓜)生育;第二,阻止外国傻瓜进入美国。戈达德也确实这么做了。他在带着助手到纽约港的艾利斯岛对刚刚踏上美国土地的移民进行智商测试。结果显示,在抽样中有83%的犹太人、80%的匈牙利人、79%的意大利人和87%的俄国人在比奈量表中智力年龄均低于12岁,也就是弱智。同时,1913年和1914年因为智力缺陷被驱逐出境的人数比之前5年的平均数增加了350%和570%。

1928年,戈达德承认自己把傻瓜的上限设置得太高,也开始倾向于比奈的看法:通过培训,傻瓜中的大部分人可以过上有意义的生活。接着,他得出两个结论:

  1. 弱智不是不可治愈的
  2. 弱智一般不需要被隔离在机构之中

如今仍被广泛使用的IQ测试表,大部分是基于斯坦福-比奈量表。该量表的创造者路易斯·特曼在比奈量表的基础上,对测试问题进行了修订。与此同时,他对于参与测试的对象也有了新的预期。不同于识别弱智的功用,特曼认为每个人都应该参与测试,只有这样,才能依据智商测试结果接力一个天赋才能的等级,人人各居其位、各司其职。这个论调听起来十分熟悉,几乎就是柏拉图曾经的梦想。根据特曼的理想,IQ在75分及以下的人,应该在没有技术要求的领域劳动;75到85分的人,主要从事半技术性劳动。要取得巨大成功,IQ需要超过115或120。特曼相信,天生智力决定了阶层界限,相应的职业、地位和薪酬等级反映的正是现存社会等级的生物学价值。通过智力量表,阶级和种族的差异也得到了合理化。

然而最终让IQ测试完全确立的,不是特曼,而是一位叫做罗伯特·耶基斯的美国人。在第一次世界大战前夕,耶基斯萌生了这样一个想法:为所有新兵做智力测试,得到的详尽、有用、一致的数据会推动心理学变为一门受人尊敬的学科。最后,耶基斯成功了,他作为上校军官,在第一次世界大战期间主管对175万新兵所做的智力测试。在他的组织上,从1917年5月到7月,耶基斯聚集了美国心理测量学界所有重要的遗传论者,包括特曼、戈达德,进行测试的编写。

他们设计了三种测试,一种叫做军队阿尔法测试,给有文化的新兵做,文盲以及在阿尔法测试中失败的人则做图像测试,也就是军队贝塔测试,在贝塔测试中失败的人要做个人测试,也就是比奈量表的某个版本。心理学家根据测试结果,为每个人确定等级,并把他们安排在军中恰当的位置上。

在军队中,这群心理学家其实并不被重视。军队测试造成的影响反而发生在军队之外。耶基斯在掌握了175万人的测试数据后,设计出了可以批量生产的书面智力测试试题。之后,“来自贸易公司、教育机构和个人的持续大量需求”,如潮水般涌来。

与此同时,对于这个基数庞大的测试产生的结果,在当时有诸多批评。比如测试的内容其实包含着文化偏见,实则是测试对象对于美国的了解程度,比如在测试过程中无法控制的场外因素等等。

军队测试数据最为直接也最为深远的影响,在于它成为了20世纪20年代《美国移民限制法案》频繁地被优生学倡导者引用,最终促进了法案的出台。时任美国总统卡尔文·柯立芝在签署这一法案时写道:“美国,必须保持是美国人的美国。”

《人类的误测:智商歧视的科学史》
[美]斯蒂芬·杰伊·古尔德 著 柳文文 译
重庆大学出版社 2017-04

本文根据《人类的误测:智商歧视的科学史》一书内容编写,同时参考了

S. Renschler, .Emily"The Samuel George Morton Cranial Collection" Expedition Magazine 50.3 (November 2008): n. pag. Expedition Magazine. Penn Museum, November 2008 Web. 22 Jun 2017 一文。

……………………………………

欢迎你来微博找我们,请点这里

也可以关注我们的微信公众号“界面文化”【ID:BooksAndFun】

来源:界面新闻

广告等商务合作,请点击这里

未经正式授权严禁转载本文,侵权必究。

打开界面新闻APP,查看原文
界面新闻
打开界面新闻,查看更多专业报道

热门评论

打开APP,查看全部评论,抢神评席位

热门推荐

    下载界面APP 订阅更多品牌栏目
      界面新闻
      界面新闻
      只服务于独立思考的人群
      打开