阅读难度:4(阅读难度为5级,第5级为最难。目前等级设定完全是主观的)
当你走进像沃尔玛(Walmart)或乐购(Tesco)这样的综合性商品店时,你会假定你会找到一种特定和可预测的组织水平。有儿童服装区,硬件区,玩具区,以及食品和杂货区。在每个区域内,通常还会有另一种可预测的次级组织水平。例如,在食品和杂货区内,产品按烘焙食品、新鲜农产品、肉类、干货进行组织。有时,甚至在这些部门内部也会进一步按品牌、功能和成分进行细分组织。你期望找到冷冻披萨在一起(一种分类组合),同时你也可能会发现意大利面酱和意大利面靠近彼此(一种功能性组合,functionalgrouping)。
这些部门之所以可预测,是因为大多数商店使用类似的分组方式;它们帮助顾客知道可以期待什么,以及在哪里找到东西。如果你在寻找冷冻胡萝卜,你会期望在冷冻豌豆附近找到它们。如果你在寻找罐装棕榈心,这可能是你以前从未购买过的一种食材,你可能会尝试罐装食品区,因为那里有其他罐装食品。换句话说,这些商店在概念上进行组织。概念性的分组是围绕所销售的产品类型及其用途设计的,这些分组使顾客更容易找到所需的物品。
你的思维方式与此类似。你的思想和记忆,虽然在神经水平上由分布连接的神经元表示,但在概念上是有组织的,这些概念反映了世界中的组织(狗和猫是自然的分组),以及功能性关系(面包和黄油搭配)。本章讨论的是概念和类别。
学完本章后,你应该能够做到以下几点:
描述并定义什么是概念,什么是类别。
理解并解释人们形成概念的主要原因。
理解并解释概念的主要功能。
了解概念表征的不同理论和说法,它们有何相似之处,有何不同之处,如何对它们进行检验。
什么是概念和类别?
概念是组织我们的记忆和思维的一种方式。概念为精神世界提供了结构。我们依靠概念进行预测、推断特征和属性,并从总体上理解物体、事物和事件的世界。对概念、类别和思维的研究强调的是类别是如何产生和学习的,概念是如何在头脑中呈现的,以及这些概念是如何被用来做出决定、解决问题和推动推理过程的。
图4.1显示了低层次感知反应(lower-levelperceptualresponses)(感知(perception)、注意力(attention)、工作记忆(workingmemory))、结构化表征(structuredrepresentations)(记忆中的概念)和高阶思维过程(higher-orderthoughtprocesses)(认知行为结果,cognitivebehaviouraloutcomes)之间的假设安排。在较低层次,信息尚未经过处理,基本上是原始的、原始的形式。原始表征(Primitiverepresentations)包括边缘、颜色、基本形状、音素等。这些原始表征接收来自感觉系统(视网膜、耳蜗等)的输入。为了让认知系统能够进行规划和决策,这些原始表征需要以某种方式进行处理和结构化。上一章讨论的是记忆以及思维如何受到记忆的影响。本章将讨论具有高度结构化的思维表征的影响。本章将探讨彼此相似的思维和想法、在神经层面上共享激活和重叠的表征,以及具有足够结构(structure)和连贯性(coherence)以进行预测、推理和实用的表征。换句话说,本章是关于概念的。
在本章中,我通常用“类别(category)”一词来指外部世界中可以被归类的物体、事物或事件,用“概念”一词来指表示该类别的心理表征。类别是对存在于思维之外的自然或其他事物的分组。概念是我们表示这些分组的方式。有时,概念能很好地反映类别,但并非总是如此。
以图4.2为例,说明如何将事物类别组织起来并表示为概念。这是从谷歌“咖啡杯”图片搜索中收集到的咖啡杯。这些杯子都很容易被识别为咖啡杯。有些比其他杯子更明显。有些杯子比其他杯子有更多的标准特征,有些杯子则有一些新颖的特征,比如枪柄或放饼干的架子(这乍看起来是个好主意,但如果你从同一面喝水,你的饼干就会滑落)。当我们学会对这些物体进行分类,并将它们识别为咖啡杯类别的成员时,我们也学会了忽略一些特异和独特的特征,而依赖于最典型和最具预测性的特征。但这一过程并不像看起来那么简单,因为许多最常见的特征(如圆柱体)也可能出现在其他类别的物体中(如酒杯、罐子、瓶子等)。我们还可以注意到,即使是那些关联性很强的特征,如手柄,也不是成为该类别成员的必要条件。咖啡杯应该是一个非常简单、直接的类别,但仍然存在相当大的复杂性和可变性。尽管如此,我们中的大多数人已经对咖啡杯形成了一个可靠的概念,我们在快速、轻松地做出分类决定时可能不会遇到什么困难。
对于像咖啡杯这样简单明了的品类,这似乎并不重要。毕竟,只要你能把咖啡放进去,它就应该属于这个范畴。但是,形成(或缺乏)稳定的概念和类别界限会带来非常严重的后果。举例来说,对乙酰氨基酚(acetaminophen)是一种止痛药,常见于泰诺(Tylenol)和其他非处方头痛感冒药中。如果让你说出对乙酰氨基酚属于哪个类别,你可能会说“药”或类似的词。你不会说“毒药”,但对乙酰氨基酚中毒是一个非常严重的问题。每年都有许多人因服用过多对乙酰氨基酚而死亡。最近的一项研究发现,对乙酰氨基酚中毒是美国急性肝功能衰竭最常见的原因之一。每年有数百人死于此病,还有数千人因此被送往急诊室(Hodgman&Garrard,2012)。事实证明,对乙酰氨基酚的治疗窗口非常狭窄。
超过建议的最大剂量,哪怕只是一点点,都可能导致中毒、住院甚至死亡。由于对乙酰氨基酚存在于许多非处方药(如感冒药和流感药)中,因此可能不容易判断您是否已经超过了这个剂量,这就加剧了这种情况。
对乙酰氨基酚被正确地归类为药物,但随之而来的是错误的假设,即它可能比实际更安全。对事物进行分类可以让你做出预测和假设。但在这种情况下,将对乙酰氨基酚归类为安全、良性的非处方药可能会导致错误。我不想给人留下对乙酰氨基酚不安全或应该避免服用的印象。按说明书服用对乙酰氨基酚是一种非常安全有效的药物。但是,将对乙酰氨基酚归类为总是安全的结果是不正确的。
分类可以让人们快速且通常准确地做出判断(例如,咖啡杯或非咖啡杯),但偶尔也会带来错误分类的代价(例如,安全药物或毒药)。
人们为什么要对事物进行分类?
刺激归纳
人们之所以会对事物进行分类,部分原因是他们天生就有归纳的倾向。刺激归纳存在于所有物种中,它意味着生物体可以将学到的行为反应扩展到一整类刺激。即使在最原始的生物体中也能看到这种现象。十九世纪,WilliamJames指出:
......智力水平极低的生物也可能有概念。它们所需要的只是再次认识到相同的经历。如果“Hollo!thingumbobagain!”这种感觉在多足动物的脑海中一闪而过,那么它就是一个有概念的思想家。(James,1890)
在这里,当James说“息肉”时,他指的是构成珊瑚的微小、有触须的水生物。而当James说“构想”时,他指的是形成概念的能力,而不是构想出另一种多肉的能力。这一概念表明,泛化(generalization),以及随之而来的将记忆归类和分组的倾向,是功能性认知结构(functionalcognitivearchitecture)的一个固有方面。正如关于相似性的第二章所讨论的那样,这些归纳(/概括/泛化)将以相似性为指导,因此行为对新刺激的反应率将是新刺激与以前所见刺激相似程度的函数。RogerShepard将此称为刺激归纳的普遍规律(Shepard,1987)。
效率
人们对事物进行分类的另一个原因是效率(efficiency)。要为一组事物形成一个概念,就需要减少关于这组事物所有成员的信息量。换句话说,概念将许多经验浓缩为一个表征。描述类别的一种方法是行为等价类。这意味着,尽管一组或一类事物可能各不相同,数量也可能很多,但我们对所有这些事物的行为方式是相同的。例如,我的猫知道罐头食品被打开的声音。虽然有许多不同的罐头,而且其中一些罐头在打开时发出的声音可能也不同,但猫对这种声音的反应却是一样的。每个罐头的个性和独特性并不重要。猫只用一种行为反应就有效地代表了整个食物罐声音的宇宙。我们对自己的概念也是如此。我们能够用一个核心表征来代表许多相似的事物。这就是认知效率(cognitiveefficiency)。概念表征(conceptualrepresentation)理论在概念表征中存储了多少信息和丢失了多少信息方面可能有所不同。大多数概念表征理论认为,概念存储的是一般信息,其认知效率要高于许多独特的个体表征。本章稍后将讨论这一区别。
概念是自然形成的
人们对事物进行分类的另一个原因是,物体和事物的世界可能在某种程度上是自我分类(self-categorizing)的。也就是说,世界上可能存在一些规律性的东西,包括物理的和功能的,而我们作为世界的居民,我们的工作就是了解这些规律性的东西。这一观点至少可以追溯到古希腊哲学家柏拉图(Plato)。柏拉图认为,作为学习者,我们在表现自然世界时,要“从自然的关节处切入”。柏拉图说的可能是猎人或屠夫如何准备吃的动物。在动物的关节处切割比直接把它砍开要容易得多。这就是为什么我们有鸡胸肉、鸡翅、鸡腿和鸡腿,而不是切成两半的鸡翅。切割动物有其自然的方法。无论人类是否决定这样做,这些自然方式都是存在的。我们可以从理论上推断,人类是根据已经存在的自然界限来划分类别的。我们之所以有水果、鸡和咖啡杯的概念,是因为这些事物在世界上彼此相似。当我们与自然世界打交道时,我们别无选择,只能按照这些原则对其进行分类和概念化(conceptualize)。
如果我们考虑到所有这些因素——形成概括的趋势、有效的中心表征(centralrepresentation)的可能性以及世界上存在的自然分组——那么,分类似乎实际上是不可避免的。
概念的功能
前面的部分描述了概念形成为一种自然而高效的过程。在这一部分,我将解答以下问题:拥有概念的一些功能(认知和行为)是什么?概念和类别如何影响思维过程?
如何应对
从根本上说,概念是一种影响人的反应的认知表征,这也是为什么概念可以被描述为行为等价类的原因。就像我的猫对罐头食品形成了行为等价类(见上节)一样,概念可以概括经验并驱动行为。一旦某个物体被归类为某个类别的成员,我们就可以把它当作该类别的成员来对待。让我们以hubbard南瓜为例。这个类别包括南瓜、胡桃南瓜、橡果南瓜和hubbard南瓜。正如你稍后会读到的,我喜欢冬季南瓜,尤其是hubbard南瓜。hubbard南瓜是一种浅绿色的大型冬季南瓜,大小和形状与橄榄球差不多(图4.3)。虽然大多数人对它有些陌生,但一旦确定它是冬季南瓜的一种,就可以照着做了。
图4.3hubbard南瓜。左侧为完整的hubbard南瓜。右侧为切开一半的hubbard南瓜。
大多数人对南瓜有什么反应呢?在美国和加拿大,烤馅饼是一种常见的反应。南瓜派由奶油冻状馅料和酥皮组成,在北美大部分地区非常受欢迎。我们称之为南瓜派,但也可以用其他冬季南瓜制作,包括胡瓜。您可以尝试烤一个hubbard南瓜派,它的味道或多或少会像南瓜派,或者至少您可以查找一个hubbard南瓜派的食谱,它的味道会像南瓜派(在我看来,它实际上更好)。而且,由于这种陌生的冬季南瓜属于你熟悉的类别,你可能知道如何切南瓜、如何准备南瓜以及在哪里购买南瓜。这样的例子还有很多:一场被归类为古典音乐的音乐会与一场被归类为民间音乐的音乐会所鼓励的态度或着装风格是不同的。被归类为甜点酒的葡萄酒鼓励以特定的方式饮用,而不是搭配牛排。
这种想法——类别有助于你知道如何行为或反应——也可能对思维过程产生令人不安的后果。这种倾向是许多负面的种族、民族和职业刻板印象的根源。因为我们的思维倾向于从我们所拥有和形成的任何概念中进行概括,所以我们可能会做出有益的概括,也可能做出无益的概括。在与本民族的人交谈时,我们可能会(甚至是无意识地)调整自己的行为,而不是与不同民族的人交谈。我们看病时的举止与在同一办公室与接待员交谈时的举止不同。相对于其他种族群体,我们对某些种族群体持有不同的态度。关于刻板印象和种族偏见的许多研究和文献都属于社会心理学的经典主题,并表明这些类别会以微妙和隐含的方式使人们的态度和观念产生偏差(Gawronski&Bodenhausen,2006;Gawronski等,2018)。
预测和推论
交流
分类也是向他人传递信息的一种有效方式。当我们学会对整类物体进行概括时,我们通常是在对多次接触或多次与刺激物互动的经验进行平均或总结。但是,这种直接的、联想式的经验显然无法传递给他人。与他人交流的最有效方式是引用已知的概念或类别。例如,你可以直接告诉你的朋友,hubbard南瓜是一种冬季南瓜,而且它还有黄橙橙的果肉、粗纤维和种子。让对方知道南瓜的类别成员身份,就能让对方获得所有类别级别的信息。这一观点将概念所表示的信息与词语所表示的信息联系起来,因此,关于类别学习和交流的一些讨论也将在关于语言和思维的第5章中涉及。
解决问题
概念和类别也在解决问题中发挥作用。人们在解决问题时经常会使用一些策略和启发式方法,包括从记忆中寻找正确的解决方案。解决问题的人可能会在记忆中寻找正确的解决方案,而不是通过解决问题的过程或应用一般策略来解决问题(Chi等,1981)。要在记忆中找到这个解决方案,就必须将当前的问题与类似的、以前解决过的问题进行比较。基于概念解决问题的想法在许多领域都存在。国际象棋高手会访问棋步类别的存储表征(Gobet和Simon,1996)。众所周知,专家级医生依赖于病人与之前就诊病人的相似性(Devantier等,2009;Norman和Brooks,1997)。此外,对于如何形成推理任务的概念,专家医生之间似乎也有很高的共识,他们会在看到病人时进行推理(Goldszmidt等,2013)。我们将在第10章和第11章进一步讨论概念表征对问题解决的作用,以及专家之间的概念表征。
现实世界中的理论
分类对人类和非人类都很重要。但对于企业、公司和机器来说,它也非常重要。例如,我们大多数人都知道,互联网公司正在孜孜不倦地收集用户数据、生成趋势并对事物进行分类,以便根据他们认为人们想要的东西做出预测。最明显的例子之一就是亚马逊购物服务的产品推荐。亚马逊会根据你之前的购买记录和浏览记录,推荐你要购买的新产品、要阅读的新书和要播放的新电影。其他公司,如Netflix、Spotify和AppleMusic,也采用复杂的算法来推荐新的观看和收听内容。
虽然这些公司使用的算法是专有的,不对公众开放,但它们会使用与你形成概念时相同的信息:经验和相似性(experienceandsimilarity)。我们通过注意群体间的相似性来形成概念,从而对事物做出预测。购物和信息流算法也是这样做的,它们能够推荐与你以往经验相似的新事物。
这些模式可以让我们深入了解自己的行为,甚至可以显示这种行为是如何影响公司运营的。伦敦大学学院的AdamHorsnby及其同事(Hornsby等,2019)最近的一项研究表明,我们的购物行为是由商店的组织方式决定的(同时也有助于形成这种组织方式)。在研究中,他们收集了一家杂货店数百万购物者的购物收据。然后,他们应用一个计算模型来寻找清单上物品的模式。从本质上讲,他们分析了收据上物品的共存性,并从中提取出了高阶概念。这些概念往往是围绕目标和模式组织的,从具体的膳食(如“炒菜”和“夏季沙拉”)到一般的主题(如“从头开始烹饪”或“现在吃的食物”)。作者的研究表明,人们会根据主题进行购物,商店也会努力围绕这些主题进行组织,这反过来又会强化基于相同主题的购物行为。
当我们购物时,我们向公司提供信息,帮助他们组织商店,方便我们购物。当你自己购物时,请记住这一点。例如,如果你购买素食食品和特定品牌的肥皂,商店就会了解你的一些情况,这也会成为他们计划的一部分,进而成为你计划的一部分。我们每个人都在观察对方,形成并修改概念,调整自己的行为,从而做出预测。
概念表征理论
心理学家用几种定义宽泛的理论方法来描述类别表征。第一类理论有时被称为经典概念观(classicalview)。这种观点强调划分类别的特征规则,从而定义概念。其中包括语义网络(semanticnetwork)和层次方法(hierarchicalapproaches)(Collins&Quillian,1969,1970;McCloskey&Glucksberg,1979),这些理论在上一章关于记忆的章节中已经讨论过。这些理论强调类别内部和类别之间的相似性关系,以及记忆中概念的组织。研究概念的第二种理论方法有时被称为概率观(probabilisticview)。与等级观点一样,这一理论也强调类别内部和类别之间相似性的重要性,但并不依赖于严格的定义方法(Smith&Medin,1981)。最后,研究人员在所谓的理论观点中论证了知识和关于世界的天真理论(naivetheories)的作用。这些方法有几种不同的实例,每种方法都提出了一些核心主张,即在概念表征中保留了多少关于单个对象的独特信息,又有多少独特信息被一般的、类别层面的信息所取代。下文将逐一讨论这些主张。
经典概念观
为了理解这些说法的本质,请看一个正方形。正方形的定义是具有四条相等的边和四个直角的形状。只要这个形状具有这些属性,我们就把它归类为正方形,事实上,这些属性一般都足以让这个形状被称为正方形。也就是说,这些属性中的每一个都是必要的,而它们加在一起,就足以成为类别成员。可以说,正方形的定义就是由这些必要条件和充分条件共同组成的。此外,一旦一个形状可以说具备了这些特征,并被视为正方形类别的成员,就很难想象还有什么会增加或减少这种分类的有效性。也就是说,只要有四条相等的边和四个直角就是正方形,这就保证了正方形的平等性。所有正方形都是平等的。
经典观的问题
我们还可以想象出具有这种定义结构的其他类别的例子——偶数是被二整除的数字,美国硬币有一定的大小和形状,由政府铸币厂生产——但是,除了一些基本的例子之外,定义的说法就开始失效了。例如,如果你现在要在一张纸上画一个正方形,你可能会画出一个看起来像正方形的东西,但它并不具备所需的四条相等的边。也就是说,你画的四条边可能并不完全相等。然而,即使四边不完全相等,你仍然会称它为正方形。更有趣的是,即使像偶数这样基本的东西也可能不那么清晰。Armstrong及其同事的一项研究发现,与“34”和“106”等数字相比,“2”和“4”更适合作为偶数的例子(Armstrong等,1983)。这对概念的定义解释来说是个问题,因为它表明即使一个类别的范例应该是同样好的成员,人们仍然会表现出典型性效应(effectoftypicality)。
事实上,典型性效应(typicalityeffect)对于任何基于定义或规则的概念解释都是有问题的。一般来说,当人们认为某些类别的范例比其他类别的范例更好或更典型时,就会产生典型性效应。一个简单的例子就是狗的类别。中等体型、常见的狗,如拉布拉多犬、寻回犬或德国牧羊犬,可能会被视为该类别中更典型和更好的范例。体型较小、无毛的狗或体型非常大的狗,虽然仍然和拉布拉多一样是狗,但可能被视为不那么典型。很容易想象出典型的例子:红苹果、四门轿车、带手柄的12盎司咖啡杯、苹果iPhone。当被要求描述一个概念的成员时,典型的物品似乎几乎会自动浮现在脑海中。
EleanorRosch对典型性效应进行了系统的研究(Rosch&Mervis,1975)。例如,在一项研究中,Rosch和Mervis要求受试者列出常见类别(如工具、家具、服装、车辆等)的所有属性。他们发现,一些范例拥有更多的属性,而这些属性也是该类别中许多其他成员所共有的。而其他范例则拥有相对较少的这些共同属性。当受试者被要求列出范例时,他们往往首先想到的就是这些高度典型的范例。它们的典型性评分也可能更高(Malt和Smith,1982)。换句话说,这些高度典型的范例似乎拥有特权地位。这对于经典概念观来说略有问题,因为严格的定义解释预示着这些典型范例不应该获得任何行为特权。然而,Rosch和Mervis的研究表明,高度典型的范例——那些似乎与其他类别成员有许多共同特征和属性的范例——更快地被分类和命名。如果人们表现出对典型范例的偏好,那么他们可能并不是依赖于某个定义或一系列必要条件和充分条件。
经典观点也难以解释家族相似性。这种观点认为,一个类别或一个阶层的成员彼此相似,但并不共享一个单一的决定性特征。家族相似性(familyresemblance)可以应用于真实的家庭成员。想象一下,一个大家庭在节假日聚集在一起。旁观者可能很容易发现,许多家庭成员长得很像。也许很多人都有某种发色或同一种眼睛。但是,不太可能有一种特征能够完美地识别家庭成员。我们可以想象很多这样的分类:猫、胡萝卜、糖果和凯迪拉克。每个成员都会与许多其他成员相似,但也许不会与所有其他成员相似。
二十世纪中叶,经典观点因无法解释家族相似性而受到严格审查。哲学家路德维希-维特根斯坦(LudwigWittgenstein)(1953:31)写道:
例如,我们称之为游戏的程序。我指的是棋类游戏、纸牌游戏、球类游戏、奥林匹克运动会游戏等等。它们有什么共同点呢?不要说:“一定有共同的东西,否则它们就不叫游戏了”——而要看看是否有共同的东西。因为如果你仔细观察,你不会看到所有游戏的共同点,而会看到它们之间的相似之处和关系,而且是一连串的相似之处和关系。
换句话说,游戏这个类别是很容易辨认的,其成员也有很多相似之处,但我们无法确定一个单一的、决定性的特征。维特根斯坦(Wittgenstein)的这一主张有助于现代人将概念理解为家族相似性组合。EleanorRosch在20世纪70年代和80年代的范式转换(paradigm-shifting)研究中采纳了这一观点。本章将讨论Rosch的工作。
层次结构和基本级别
图4.4分类法中等级表示法的另一个例子
图中显示的是假设的上级类别、基本类别和下级类别层次。类别成员内部和之间的相似性在每个层次上都有所不同。主要的对象识别和分类发生在基本层级。
中间层被称为基本层(basiclevel),是一种特殊情况。在这里,类别内的相似性很高,但类别间的相似性很低。虽然“狗”类别中的成员往往长得很像其他的狗,但是“狗”类别、“猫”类别、“蜥蜴”类别和其他动物类别中的成员之间的重叠程度并不高。基本层级类别是指类别内相似性最大,同时类别间相似性最小的层级。因此,相似性和/或特征是判断类别成员的可靠线索。狗有狗的形状,与其他狗的相似性最大,与其他类别的相似性重叠不多。树、汽车、桌子、锤子、杯子等也是如此。
基本层类别(Basiclevelcategories)在其他方面也很特别。20世纪70年代,EleanorRosch及其同事(Rosch等,1976)观察到,基础层级类别是最抽象的层级,在这个层级上,一个类别中的物体往往具有相同的形状、相同的运动动作,而且往往具有相同的部分。由于对比类别易于比较,而且相似性是一种预测线索,因此基本层类别也显示出一种命名优势。也就是说,如果给你看一个GrannySmith苹果的图片,你很可能会把它命名为“苹果”,而不是“水果”(上位)或“GrannySmith”(下位)。此外,在命名方面,儿童较早学会的是基本层类别,当被试者被要求列出上位类别的成员时,他们会首先列出基本层类别。总之,Rosch和其他许多人的研究表明,尽管物体可以在许多不同的层次上进行分类,但人们似乎是在基本层次上对物体进行操作和思考的。
当然,并不是所有的对象类别都能一直在基本层面上进行分类。在某一领域拥有丰富经验的人可能会本能地在一个更次要的层次上进行操作(Harel&Bentin,2013;Johnson&Mervis,1997;Tanaka&Taylor,1991)。举个例子,假设您是一位苹果专家——您是一位果园主——就像前面的例子一样,有人给您看了一张GrannySmith苹果的图片;与新手不同的是,新手的反应是“苹果”,而作为专家,您的反应可能是“GrannySmithApple”。
一些研究证实了这一结果。例如,Johnson和Mervis(1997)对鸟类专家、鱼类专家以及新手进行了多项关于分类和属性生成的研究,他们发现,尽管基本层级仍保留着特权地位,但受试者的专业知识却能增加对次级层级分类信息的获取,甚至对高级专家而言,还能增加对次级层级分类信息的获取。其他研究人员也发现了同样的效果(Harel&Bentin,2013;Tanaka&Taylor,1991)。换句话说,如果您是专家,您的基本层(basiclevel)实际上是一个从属层(subordinatelevel)。
概率观
Rosch的研究直接提出了一种可能性,即类别成员资格是概率性的。一个概念不是建立在一系列必要条件和充分条件的基础上,也不是停留在一个严格的等级体系中,而是被认为代表了一个由具有共同特征和重叠相似性的事物组成的类别。在这种被广泛称为概率观点的解释中,类别成员资格并不是确定的。相反,分类表征(categoricalrepresentation)是根据相似性(similarity)分级的。成员资格分级意味着类别成员与类别的契合程度各不相同。类别成员偶尔会被错误归类,但同时,高度典型的类别成员很少被误认为是目标类别的好例子。
例如,我们可以考虑“狗”这样一个非常普通的类别。要确定一组必要条件和充分条件可能是不可能的,但要得出狗这一类别的一组特征却很简单。狗通常有尾巴,通常会叫,有四条腿,有皮毛等等。如果缺少这些特征中的一个,可能会降低狗的视觉典型性,但这并不会使它们失去成为狗类成员的资格。一只小吉娃娃可能没有毛,而且比许多其他狗小得多,但我们并不认为它是另一个类别的成员。我们可能见过少了一条腿的狗,但即使它没有“四条腿”的特征,我们也不会认为它不是狗。
不过,我们可以想象,有些狗拥有大多数特征:体型中等、有四条腿、有尾巴、会叫。金毛寻回猎犬可能就是一个很好的例子,它是一种非常典型的狗,具有这些特征中的许多特征。这样的狗也很有可能比一只小巧、无毛的吉娃娃更快、更容易被归类为狗的一员。概率论观点认为,这两种狗都属于狗类,但金毛寻回猎犬更具典型性,因此是一个更好的例子。换句话说,如果你要进行错误分类,那么你在吉娃娃身上犯错的概率要比在金毛寻回犬身上犯错的概率高。
在概率视角下,典型的范例或类别成员被更快地识别出来,因为它们与其他类别成员共享更多的特征。从某种意义上说,典型的类别成员更接近类别的中心。类似的效果可能会在例外类别成员中观察到。一个类别中非常不典型的成员(比如蝙蝠作为不典型的哺乳动物,甚至作为不典型的鸟类,如果你的“鸟”类别是基于可观察特征的话)实际上是一个离群值。确实,蝙蝠作为哺乳动物类别的成员表现得很差。它看起来像鸟,行为像鸟,视力也不好。概率分类系统会假设蝙蝠会被误分类,并给人们带来一些困难。我们自身无法轻松分类它们,这种事实可能对应于蝙蝠经常被人们害怕的现象。或许我们害怕蝙蝠,因为它们不能轻易地归入一个简单的、基本的类别。
但这种类别内在的分级典型结构(gradedtypicalitystructure)是如何在大脑中作为一个概念被表示的呢?概率视角可以通过多种方式实现。传统上,有两种相对立的解释。原型理论(prototypetheory)假设类别由一种被称为原型的中心趋势表示。范例理论(exemplartheory)则假设类别由许多存储的记忆痕迹(即范例)表示。这两种解释都做出了类似的预测,但它们在存储个体信息与存储类别信息的程度上有所不同。下面我将讨论这两种解释。
原型理论
原型观点认为,一类事物在头脑中以一个原型表示。这个原型被认为是该类别的总结性表示。这个原型可以是类别成员整体的平均值、某种常见特征的列表,甚至是一个理想模型(Murphy,2002)。根据这种观点,对象通过与原型进行比较来分类。一个对象被归类到与其最相似的原型的类别中。
尽管Rosch关于家族相似性的研究激发了原型理论,但最有力的原型表征证据来自于原型抽象(prototypeabstraction)的实验研究。一个常见的实验范式可以追溯到20世纪60年代末和70年代初,试图展示人们如何从对个体刺激的经验中抽象出一个原型。基本范式(basicparadigm)要求参与者观看一组新颖的视觉刺激,直到他们形成了该训练集的概念表征。随后,参与者会观看额外的刺激,并将其分类为他们刚学到的类别的成员(或不是)。这些是新颖的、相对任意的类别,但它们确实具有一定的内部结构,任务的设计目的是让参与者以无监督的方式发现内部结构,类似于自然类别的学习方式。
受试者通常接受原始形状变形的训练。在训练过程中,受试者通常不会看到原型。
受试者被要求观看图4.5右侧列中显示的40个(或更多)训练示例。这些多边形中的每一个都是由屏幕上的九个点的单一配置生成的(见图的左侧)。这些点可以用线连接形成多边形。图顶部的三个形状展示了一组用线连接的点,随后这些线被移除。这个原始配置(点或由点构成的形状)就是用来生成所有其他刺激的原型。
为了生成测试刺激,研究人员依赖于一种算法,该算法会微调图中每个点的位置。为了创建一个看起来很像原型但不完全相同的对象,算法会稍微移动每个点的位置。由此产生的形状类似于原型,但并不完全相同。可以把这想象成北斗七星星座,图中的点类似于星星。如果你稍微移动这些星星,星座仍然会类似于北斗七星,但会有一点不同。使用这种算法,研究人员创建了一组与原型相似但不完全相同的刺激。
在这个任务的标准版本中,参与者在许多试验中会观看大量的训练刺激。请记住,训练刺激是通过变形原始原型创建的,但研究中的参与者看不到原始原型。每次他们看到图像时,他们被要求研究几秒钟,直到看到下一张图像。在多次呈现图像后,假设参与者已经抽象出一些关于他们刚刚体验过的整个图像类别的东西。作为类比,假设你对鸣禽一无所知:你从未见过任何鸟,无论是活的还是图片形式的。现在假设有人给你看几百张鸣禽的照片。即使你对这个类别一无所知,通过观看这些图片你可能也会抽象出一些关于这个类别的东西。九点多边形任务的工作原理大致相同。
当然,学习关于鸣禽的知识可能也是以同样的方式进行的。
在训练和类别抽象之后,参与者会接受额外的刺激测试。其中一些测试刺激是与被试接受训练的相同刺激的副本,但其他刺激则是新的例子。与鸟类示例相符,这就像展示了一些你学习过的鸟类的图片,以及那些与训练鸟类的图片相似度不同的新鸟类。测试示例包括许多与原型高度相似的新刺激,与原型相似度低的新刺激,以及与原始原型没有任何关联的新随机模式。至关重要的是,一些新的测试刺激是该类别的实际原型。这是用来创建刺激的原始模式,但在学习阶段实际上从未呈现过。如果被试从他们的例证经验中抽象出了原型,那么他们在测试阶段应该能够识别出原型,即使他们从未见过那个原始原型。如果我们测量参与者对每种刺激的反应,我们应该会发现一种模式,在这种模式中,(之前未见的)原型和高典型性的例证被强烈认定为是类别成员,而低典型性的例证则没有被认可。
在许多研究和实验中,确实发现了这种模式。图4.6显示了来自几个不同实验的被试的表现(Minda&Smith,2011)。明显的是,对于原型项目的表现非常强,超过了其他新刺激的表现,而这些原型项目在学习阶段从未被看到过。此外,对于所有新项目,都可以看到一个明显的典型性梯度,即具有一定相似度较高的原型的典型项目比具有较低典型性的项目更受认可。这种模式在许多几十项研究中的普遍存在支持了这样一种观点:对于某些类型的类别,学习新类别涉及到一个原型抽象过程(Knowltonetal.,1992;Minda&Smith,2011;J.D.Smith,2002;J.D.Smith&Minda,2002;J.D.Smithetal.,2008)。
范例观
原型的替代方案是范例理论(exemplartheory)(Hintzman,1986;Hintzman&Ludlam,1980;Medin&Schaffer,1978;Nosofsky,1986,1987)。在这种解释中,我们假设类别在头脑中被表示为每个类别成员在记忆中存储的记忆痕迹(典型)。换句话说,与原型模型中的额外抽象不同,这里我们不需要额外的抽象,而是个体事物的记忆痕迹之间的相似性使我们能够将它们视为同一类别的成员。我们之所以将一个动物归类为“狗”,并不是因为它与一个抽象相似,而是因为它与我们已经将其归类为狗的许多事物相似。
从图4.7可以立即清楚地看出,两个类别看起来同样容易学习。两者都没有非常明显的家族相似性,但也没有看起来特别困难的地方。在实验设置中,非线性可分离的类别与线性可分离的类别一样容易学习(Medin&Schwanenflugel,1981;Nosofsky,1987)。然而,原型模型无法学习非线性可分离的类别,但是一个基于分类是基于记忆的典型痕迹的假设的典型模型可以。研究普遍证实了这一预测(稍后将讨论一些注意事项)(Nosofsky,1987,1992,2011)。
尽管上面的例子看起来有些刻意,但至少有两个值得考虑的问题。首先,无论是刻意安排的还是非刻意的,人们似乎并不对这些非线性可分离的类别有任何特别困难。这表明,支持类别学习的认知机制(cognitivemechanisms)不一定会受到类别划分的非线性性质的阻碍。其次,考虑一个类别,比如哺乳动物,其中海豚是一个明显的异常值。它们与其他哺乳动物并不共享许多显性特征,并且与鱼类类别的成员共享相当多的特性。鉴于自然和人工类别可能以许多形式存在,我们似乎不仅仅被限制在学习原型,而且还可以依靠典型学习来处理这种不规则类别(典型过程可能也非常适合许多常规类别)。
正如前面提到的,人们学习非线性可分离类别的能力有一定限制。几项研究发现,随着类别大小和复杂性的增加,对线性可分离性约束的依赖性也增加(Minda&Smith,2001;J.D.Smith&Minda,1998;J.D.Smithetal.,1997)。在这种情况下,受试者不仅发现线性可分离类别更容易学习,而且他们也学会了很好地对原型和高典型性项目进行分类,同时错误地将异常项目归类(想象一下有人总是把海豚归类为鱼)。这种模式更符合原型方法,Smith和Minda(1998)认为,对于许多类别来说,原型抽象在学习的早期阶段尤其重要,因为在学习特异刺激的具体典型例子之前,学习者需要学习原型。
理论观
根据这一观点的支持者,概念和类别是在现有知识和个人对世界的天真理论(naivetheories)的背景下学习的。例如,当我学习一种新的冬季南瓜(比如一种hubbard南瓜)时,我不仅仅是看到南瓜,将它们分类,并接收反馈。相反,我会将它们与我已经了解的东西联系起来。我可能会注意到它与南瓜相似,因此我已经预期某些特征会被呈现。先前存在的知识有助于激活和优先考虑特征。
此外,由于理论观点依赖于关于对象和概念的知识,而不仅仅是相似性,它可能能够解释一些奇怪的发现,即人们似乎经常忽略他们自己的相似性判断。在Rips(1989)的一项研究中,受试者被要求考虑一个直径三英寸的圆形物体和两种可能的比较类别,即一个25美分硬币和一个比萨饼,如图4.8所示。一组受试者被要求做相似性判断,并评价三英寸圆形物体与25美分硬币或比萨饼之间的相似度。毫不奇怪,受试者认为三英寸圆形物体更类似于25美分硬币。然而,当受试者被要求指出他们认为三英寸物体属于哪个类别时,他们几乎一致选择了比萨饼。这有两个原因。
图4.8Rips(1989)进行的实验示例,其中参与者被要求比较直径三英寸的圆形物体与25美分硬币以及同一物体与比萨饼之间的相似度。
总结
在随后的章节中,我们将看到概念在思维中的重要性。例如,在语言与思维的第五章中,一个关键的概念涉及定义一组事物的语言边界(例如基本颜色或家庭用品)。归纳(第六章)涉及使用概念根据类别成员资格进行推理和预测。演绎逻辑(第七章)通常涉及得出关于整个事物类别的结论或评估所得出的结论:范畴论证。在问题解决和决策方面,类别和概念提供了一个框架。概念为我们的经验提供了连贯性,这对于思考是必要的。
值得思考的问题
人们建议形成围绕感觉上相似或共享特征或具有相同行为功能的对象的概念。除此之外,你可能会通过哪些其他方式形成概念?这些概念会如何表示?
概念在思维和行为中的主要功能是什么?你能想到其他概念功能吗?
为什么原型模型有线性可分约束?也就是说,为什么类别需要线性可分才能使基于原型的分类有效?这是否意味着原型不是概念的现实理论?