样例学习理论

样例 学习理论

什么是样例学习理论

样例学习理论(exemplar theory)也是针对基于规则的概念形成理论——假设检验理论的缺陷提出来的,但是它同时可以解决基于线索的概念形成理论的缺陷。这个理论认为,概念的表征包括了对于各种样例的描述,概念形成的过程就是积累样例来表达概念的过程。

假设检验理论认为,人们头脑中的概念是有着明确界限的。例如“三角形”这个概念,凡是符合“有三条边”和“封闭”等条件的几何图形都是三角形,凡是不符合上述特征的都不是三角形。三角形和非三角形之间界限非常清楚。但是,日常生活中的概念却并非如此。对于有些样例,可以很明确地认为它属于某个概念;还有一些不典型的样例,有时很难说清楚它们的归属。

例如,如果问:“椅子是不是家具?”则人人都会十分明确地回答:“是。”但是,如果问:“书立(书架上使书直立的物件)是不是家具?”人们的回答就大不相同,有人说是,有人说不是。这说明,有些概念没有清晰的界限。例如“家具”就是这样,像书立这样的东西,可以看作是家具,也可以看作是文具。又如,“家用电器”也是一个界限很不清晰的概念,如果问:“手机是不是家用电器?”回答也是多种多样的。

为了解决上述问题,罗施和默维斯(Rosch,1973a;Rosch,1973b;Rosch&Mervis,1975)提出,假设检验理论是以对人工概念的研究为基础的,而人工概念不能成为实际生活中的概念的代表。罗施认为,自然情况下,概念形成以样例学习为主。在她看来,自然概念不像人工概念那样有准确的定义,其样例上的特征不像人工概念那样明确而有限。自然概念的内涵和外延往往比较模糊,因而比人工概念复杂得多。因此,人们头脑中的自然概念不是一个或几个关键特征,而是对概念样例的记忆,不同的样例都可以不同程度地表征概念。换句话说,自然概念的形成用不着假设检验的参与,记忆中有代表性的一个或几个样例,就是概念存在的形式。

图8-6就是样例学习理论所认为的关于概念“鸟”的表征形式。从图中可以看到,一个概念(例如“鸟”)可以用多个样例来表征。这些样例之间也存在一些差别:前三个样例其实也是概念,是鸟的下位概念,而“悦悦”则是一只真实存在的宠物鸟。当样例本身就是一个下位概念的时候,它又可以进一步用两种形式来表达:一是罗列出它的相关特征,例如图中的“知更鸟”;二是用更下位的样例来表示,例如“北美蓝鸟”和“麻雀”。当然,这两种方法也可以同时采用。

在用样例来表征概念时,剔除个别样例对于概念表征影响不大,这是有别于基于规则的概念形成的一个重要特征。(https://www.daowen.com)

图示

图8-6 概念的样例表征

(来源:Smith&Medin,1981)

那么,自然概念究竟是怎样形成的呢?我们小时候学习什么是“鸟”这个概念的时候,大人总是指着天上飞的麻雀、燕子说:“这就是鸟。”久而久之,我们心目中的“鸟”就成了麻雀或燕子那种模样了。也就是说,“鸟”这个概念在我们头脑中的储存方式是一个或几个有代表性的样例的形象,而不是一系列特征的罗列。罗施进一步指出,对于某个概念来说,不是每一个正例都是它最好的例子。例如,“麻雀”“燕子”等可以说是“鸟”的良好的、有代表性的例子,而“鸭子”“鸵鸟”却不是“好例子”,确实,在实际生活中,许多人甚至不知道鸭子也是鸟。可见,自然概念在我们头脑中储存了两方面的内容:样例及其代表性程度。

样例学习理论得到了一些实验(Rips,Shoben&Smith,1973;McCloskey&Glucksberg,1979;Rosch,1973)的验证。例如,让被试判断一系列的句子是否正确,结果发现,被试对于“知更鸟是鸟”(A robin is a bird)这个句子的反应比较快,而对于“小鸡是鸟”(A chicken is a bird)的反应比较慢。

默维斯等人(Mervis,Catlin&Rosch,1976)让被试直接列出给定概念的例子,发现被试倾向于列出典型的例子而不是非典型的例子。

另外,在语义启动效应的研究中,高度典型的样例常常可以达到更强烈的启动效应。

基本水平概念

罗施及其同事的另一个重要理论就是关于分类原则的讨论。分类是粗略一些好还是细致一些好?当然要根据不同的要求作出选择。一方面,人们希望将不同类别的事物尽可能地区分开来,以便区别对待;另一方面,人们又希望将不同的事物合并归类,以便用相同的方法来处理相似的事情。这就需要我们在“分”(分类)与“合”(归类)之间找到一个平衡点。

在人类知识体系中,概念是分层次的。例如概念“动物”下面包括动物的子集:“鸟类”“哺乳动物”“鱼类”等,“哺乳动物”下面又包括“犬科动物”“猫科动物”等,“猫科动物”下面又有“老虎”“狮子”等概念。对于动物学家来说,自然区分得越细致越好;但是对于普通人来说,分得太细并无必要,相反还不必要地耗用很多认知资源;而不作任何区分当然也不行,因为不能作出必要的区别反应。这样,就需要寻找一个基本水平:这个水平的概念(或分类)既足以让个体作出恰当的反应,又不占用过多的认知资源,从而达到认知经济学的要求;如果在基本水平概念(basic-level concept)的上位概念的层次进行分类,就觉得太笼统,甚至找不出很典型的例子;如果在基本水平概念的下位概念的层次进行分类,又觉得这样的细致分类并没有给出更多的信息。

罗施提出,基本水平概念需要满足这样两个条件:第一,概念所指类别中的成员之间有较大的相似性;第二,类别与类别之间有较大的差异性。简单地说,就是“类内差异要小,类间差异要大”。

举例来说,“钢琴”和“吉他”就是两个基本水平概念。钢琴和吉他虽然都是乐器,但是它们之间差别很大,不宜归为一类;而钢琴类内部的成员(三角钢琴和竖式钢琴)差别比较小,不同的吉他之间相差也不大。因此,一般情况下,不必继续细细分辨,因为我们不再关心演奏者弹奏的是哪一种钢琴或吉他。

基本水平概念是表象和形象思维的基础。因为基本水平概念往往可以找到一个或多个典型的样例,这使得我们能够对于这一类概念中的事物产生一个概括性的表象,这使得形象思维成为可能。当一个人想象自己驾驶着汽车在高速公路上奔驰的时候,不必费神去确定开着什么牌子的车。

基本水平概念对知觉也有重要意义。罗施指出,一个具体的事物总是首先会被知觉为某一基本水平概念的成员,在得到进一步信息之后才会被知觉为基本水平概念的上位概念或下位概念的成员。所以,我们看到一架钢琴时,总是先辨别出它是钢琴,然后才说得出它是哪一种钢琴(下位概念),或概括地说这是一种乐器(上位概念)。

在儿童的发展过程中,基本水平概念起着重要作用。父母们总是先教孩子那些基本水平概念,例如“椅子”“桌子”“灯”等,而不会先教它们的上位概念——“家具”,也不会先教它们的下位概念——“竹椅”“木椅”“沙发椅”“餐桌”“写字台”“吊灯”“台灯”等。只有在掌握了一系列基本水平概念后,才有可能教会儿童更抽象的上位概念。

在我们的语言中,最常用到的也是基本水平概念。即使一个人看到一把名贵红木做的椅子,也往往称其为“椅子”,不会说“红木椅子”,也不会说“家具”。当然,如果为了突出椅子的珍贵,必要的时候还是会说“红木椅子”。

另外,从语言进化的角度来考察,基本水平概念在语言中也更具活力,因为它们向上进一步可以抽象为上位概念,向下则可以具体化为下位概念。更有趣的是,在聋哑人的哑语中,比较简单的动作大多数都被用来记录基本水平概念。

样例学习理论的缺陷

但是,以后的研究又发现,样例学习理论也并不能完满地解释自然概念的形成。

例如,马丁和卡拉马扎(Martin&Caramazza,1980)提出,成人在某些情况下会使用假设检验策略来形成自然概念。他们让被试对一些脸谱进行分类,并告诉这些被试(都是大学生),脸谱中没有哪一个或哪几个特征可以总是作为分类的决定性依据。尽管这样说了,被试却还是采用了假设检验策略,即系统地考察脸谱的各个具体特征并进行分类。

可见,样例学习理论和假设检验理论应综合考虑。奥谢森和史密斯(Osherson&Smith,1981)提出,人们记忆中可能存在两类信息,一类是样例信息(对样例的记忆),另一类是类别信息(概念的定义、关键特征以及特征间的相互关系),前者用于迅速判断,后者用于逻辑证明。每一个概念都有类别信息和样例信息。

根据上述理论,自然概念除了有样例信息以外,还应当有类别信息。用这个观点来考察上述采用假设检验策略来形成自然概念的实验,就容易理解了:正是自然概念的类别信息形成了假设检验的基础。

同样,人工概念也会有样例信息。阿姆斯特朗等人(Armstrong,Gleitman&Gleitman,1983)发现,精确定义的概念(虽然它们不是严格意义上的人工概念)也有样例信息。他们让被试评价一些数字“像”奇数或偶数的程度。这实际上就是让被试评价样例的类别隶属程度。照理说,奇数就是奇数,偶数就是偶数,哪有像不像的道理。可是实验结果却是,被试对不同的数字有不同的评价。此外,他们还让被试评价“母亲”“主妇”“公主”“女招待”“女警察”“喜剧女演员”是不是“女性”好的(有代表性的)例子,接着又评价各种不同的几何图形是不是“几何图形”好的例子。这实际上也是测定类别隶属程度,结果也发现了隶属程度的差异(见表8-7)。

表8-7 被试对一些样例的隶属程度评价

图示

(来源:Armstrong,Gleitman&Gleitman,1983)