特征分析理论
特征分析理论的基本思想
既然模式是一组刺激或刺激特征组成的一个有空间和(或)时间结构的整体,特征分析理论(feature analysis theory)就首先将模式分解或还原成它的原来特征。例如,字母A可以分解为一条横线、两条斜线和三个锐角。特征分析理论认为,人的头脑中,各种模式是以它们分解后得到的一系列特征的形式来表征的;模式识别的过程就是抽取当前刺激的各方面的特征,与记忆中的各种模式的特征进行比较,找到最佳的(至少是最满意的)匹配。
吉布森(Gibson,1969)曾列表说明每一个拉丁字母的各种特征组合(见表3-1)。
表3-1 吉布森给出的大写字母的特征组合表

(续表)

(来源:Gibson,1969)
不过,同样对于这26个大写字母,不同的学者可能给出不同的特征组合。表3-2是林赛和诺曼(Lindsay&Norman,1977)总结的字母特征组合表。
表3-2 林赛和诺曼给出的大写字母的特征组合表

(续表)

(来源:Lindsay&Norman,1977)
以识别字母A为例,根据戈尔茨坦(Goldstein,2005)的描述,大致可以分为两个阶段。第一阶段是特征分析阶段。字母A可以激活三个特征:一条斜线“/”,一条斜线“\”和一条水平线“-”。第二阶段是字母分析阶段。26个字母各有一套特征集合,每个字母特征集合都可以与第一阶段激活的部分特征进行比较,由于字母A的特征集合与上述三个激活的特征最接近,因而字母A在字母分析水平得到最强烈的激活,从而得到识别;而其他字母(例如“N”或“T”等)也可能由于部分特征得到匹配而得到一定程度的激活,但是其激活程度不能和字母A相比,因而在正常情况下不会被误认。
塞尔弗里奇(Selfridge,1959)的魔域模型(pandemonium model)是较早提出的比较复杂的模型。这个模型也是以字母识别为例来说明特征分析的过程。“魔域”就是用来完成字母识别的系统。在这个魔域中,有四种小鬼,各司其职,相互配合(见图3-5)。四种小鬼在不同的层次上完成自己的工作。直接与刺激(图中的字母R)接触的是映象鬼,它负责将字母的形象输入到“魔域”里面,产生对字母形象的表征,以便接受进一步加工。接下来,各种特征鬼对映象鬼送来的表征进行扫描,每个特征鬼都负责寻找一种特征,例如水平线、垂直线,等等。当某个特征鬼发现自己负责的那个特征时,就使劲叫喊,作出响应。更高层次的鬼叫认知鬼,每一个认知鬼负责对一个特定的字母作出响应。它们“倾听”特征鬼的叫喊,如果发现叫喊着的特征鬼与自己负责的字母的一系列特征相对应,就同样叫喊着作出响应。不过,它们的叫声有大有小,如果对应的特征少,叫声就小些;如果对应的特征多,叫声就大些。最后出场的是唯一的决策鬼,它的任务是倾听认知鬼的叫喊,作出最后的决策。

图3-5 魔域模型示意图
(来源:Goldstein,2005)
特征分析理论的实验验证
来自神经生理学方面的证据
早在1959年开始,休贝尔和威塞尔(Hubel&Wiesel,1959,1963)就开展了关于视觉感受域的一系列研究。他们将微电极植入猫和猴子的视觉皮层中,然后向这些动物被试呈现各种图形刺激,记录这些图形引起的单个神经元的冲动。当光刺激作用于视网膜时,有些神经元发生冲动,有些神经元没有反应,这样就可以得到视网膜的不同部位与不同神经元的对应关系。视网膜上与某个神经元相联系的区域,就是这个神经元的感受域(receptive field)。研究发现,有一些神经元只对视野中的垂直光条发生反应,另一些神经元则只对水平光条发生反应。进一步的研究还发现,视觉皮层中还存在着分别只对视觉刺激的某种边界、线条、夹角甚至运动作出特异性反应的特殊神经元。这说明,皮层中不同的神经元具有不同的感受域,这种分工使得个体能够区分不同模式的特征。休贝尔和威塞尔将这些神经元称为特征检测器(feature detector)。图3-6就是一种只对一定方向的线段作出反应的特征检测器。可以推想,在人的皮层中也应该有特征检测器。

图3-6 只对一定方向的线段作出反应的特征检测器
(来源:Hubel&Wiesel,1959,1963)
根据感受域的研究,休贝尔和威塞尔进一步将特征检测器分为简单神经元、复杂神经元和超复杂神经元三种水平。简单神经元直接从视网膜上的感受器获得输入,并对某种简单模式(例如边界、细缝、线条等)产生反应;复杂神经元从特定组合的若干个简单神经元那里获得输入,以确定是否应当产生反应;再进一步,就是超复杂神经元从特定组合的若干个复杂神经元那里获得输入,以确定是否应当产生反应(见图3-7)。这样,个体就能够分析越来越复杂的特征组合,从简单神经元只能检测边界、细缝、线条等简单特征,到超复杂神经元可以检测一定大小的刺激的运动或特征之间的关系。

图3-7 简单神经元、复杂神经元和超复杂神经元之间的关系
(来源:Hubel&Wiesel,1959,1963)
来自实验心理学方面的证据
奈瑟(Neisser,1963)通过一系列的视觉搜索实验证明个体是采用特征检测的方式来识别字母的。在实验中,被试的任务是从许多字母中搜索某个目标字母,例如分别在表3-3的两组字母中搜索字母Q或Z,并记录被试搜索目标字母花费的时间。实验条件分为两种,两者之间的区别在于非目标字母的特征。A条件下,材料中的非目标字母都是直线字母(A,E,I,H等),B条件下则都是曲线字母(B,C,D,G等)。结果发现,同样是搜索字母Q或Z,在A条件下搜索,字母Q容易找到,而字母Z不容易找到;而在B条件下搜索,情况正好相反。如果采取的是模板匹配方式,由于识别字母Q或Z时用于比较的模板是相同的,所以两种搜索条件下的搜索时间应该是相同的,不应该有这样的差别。这就证明,目标字母的识别不是依靠模板匹配,而是通过特征检测:A条件下,被试只要搜寻到字母Q独有的曲线特征就能作出反应,而字母Z的特征和非目标字母相同,没有独特的区别性特征,因而造成搜索字母Q快于搜索字母Z;在B条件下,字母Z有独特的区别性特征而字母Q没有,结果就反了过来。
听知觉当中也有类似的情况,两个音节之间共有的特征越少,就越不容易混淆。例如,da和ta相对来说比da和sa更容易混淆,因为da和ta的区别在于辅音的清浊,而da和sa除了辅音一清一浊之外,还有一个区别:d是爆破音,s是摩擦音。
关于静止网膜像的实验也为特征分析理论提供了支持性证据。普里查德(Pritchard,1961)采用一种技术使刺激图形在视网膜上成像的位置不因眼球的不随意运动而改变,即产生静止网膜像(stabilized image)。结果发现,被试对于图形的知觉在维持了很短的时间后逐渐消失。但有趣的是,这种消失是渐进的(见图3-8)。图中最左边是刺激图形,右边4个图形是知觉渐进性消失的过程中,被试报告出来的图形片断。从图中可以看出,无论是消失的部分,还是暂时保留下来的部分,都是相对完整的特征。这说明,知觉的基本单元就是特征。
表3-3 奈瑟的字母搜索实验材料(https://www.daowen.com)

(来源:Neisser,1963)

图3-8 静止网膜像实验
(来源:Pritchard,1961)
特征整合理论
特征整合理论(feature integration theory,简称FIT)是特雷斯曼(Treisman,1982)在施奈德和希夫林关于自动加工和控制加工的理论基础上发展出来的,她将这两种加工的配合方式更加具体化,提出了模式识别的双阶段模型:在模式识别过程中,第一个阶段是前注意阶段,其加工方式是自动加工或平行加工;第二个阶段是特征整合阶段,其加工方式是控制加工或系列加工。特雷斯曼认为,在早期的前注意阶段,物体的特征处于“自由漂移”的状态,认知系统中只能首先形成一“特征地图”;而在后期的特征整合阶段,各个特征犹如经过胶水“粘连”而结合在一起,形成一“位置地图”,对于物体的知觉就这样完成了。
特雷斯曼做了很多实验来证明她的理论,主要有视觉搜索实验和错觉性结合实验。
视觉搜索实验
特雷斯曼和格雷德(Treisman&Gelade,1980)共同完成的一个视觉搜索实验中,向被试呈现一系列简单的刺激(例如字母),这些刺激在多个维度(例如颜色和形状)有不同之处,接着设置了两种实验条件。第一种条件是:要求被试在其中搜寻一个具有独特特征的目标刺激(例如,在一些其他颜色的字母中搜寻一个粉红色的字母,或从其他字母中搜寻一个不论何种颜色的字母T)。在目标刺激具有独特特征的情况下,目标刺激与作为背景的其他分心刺激在关键特征上明显不同,例如在一些绿色和棕色字母中搜索一个粉红色字母,关键特征就是颜色的不同,被试甚至不用看清楚字母,就可以指出那个粉红色的字母。而从多个字母O中搜索字母T,关键特征就是形状,可以不管目标刺激是什么颜色。结果表明,这种实验条件下的目标刺激仿佛会自动地弹射出来,无需费力寻找。而且,分心刺激的个数不会影响被试的反应时。而这正是自动加工的典型证据。这说明,要检测出一个单一特征是相对容易的,在前注意阶段就能完成。
第二种条件是:要求被试搜寻一个具有结合性特征的目标刺激,而作为背景的分心刺激可以具有两个参与结合的特征中的一个。例如,要求搜索一个粉红色的字母T,但是在分心刺激中有粉红色的其他字母,也有其他颜色的字母T。实验结果表明,在这种情况下,被试的反应时会显著延长,而且随着分心刺激数目的增加而继续显著增加。这正是控制加工或系列加工的特征:从机制上讲,要完成这样的搜索,必须逐一比较目标刺激和分心刺激的颜色和形状,而不能仅仅根据颜色或仅仅根据字母形状就直接作出判断;从时间上讲,它完成的时间比较靠后,应该属于后期的特征整合阶段。
特雷斯曼和索瑟(Treisman&Souther,1985)还采用非对称性搜索任务进一步证明特征整合理论。
非对称性搜索,指的是这样的情形:在若干个A类项目中找到一个B类项目,与从同样的若干个B类项目中找到一个A类项目,两者的搜索速度有显著差异。
如图3-9所示,要求被试完成两种不同的搜索:(A)从若干个
中搜寻一个
,或者反过来,(B)从若干个
中搜寻一个
。结果表明,A搜索要比B搜索快得多。而且,A搜索条件下分心刺激的数目不显著影响被试的反应时,而B搜索条件下分心刺激的数目越多,反应时越长。由此推想,A搜索应该是自动加工的,产生的是相对简单的特征地图(被试只要看到圆上有条小“尾巴”就能作出肯定的判断);B搜索应该是控制加工的,产生的是位置地图(被试必须将圆和竖线这两个特征结合起来,将目标刺激与分心刺激逐一比较,才能最终作出正确的反应)。

图3-9 非对称性搜索实验
(来源:Treisman&Souther,1985)
错觉性结合实验
错觉性结合指的是在注意分散或过载时不同客体的特征发生彼此交换的现象。例如,呈现的是绿色的X和红色的O,被试却报告绿色的O和红色的X。特雷斯曼和施密特(Treisman&Schmidt,1982)做了不少这样的实验,试图以此来证明,在知觉的初期,特征是处于“自由漂移”的状态,以后才出现特征间的结合,当然也就可能产生错误的结合。
特雷斯曼和施密特采用字母、图形和文字作为刺激材料,都发现了相应的错觉性结合。这里介绍两个以字母为材料的实验。
第一个实验是用速视器向被试呈现卡片,卡片上两边印着数字,中间印着字母。被试的任务是先报告数字,例如图3-10中的“6”和“2”,再报告看到的字母及其位置与颜色。实验中涉及的字母有5个(T,S,O,N,X),颜色也有5种(粉红、黄、绿、蓝、棕)。对于数字的报告有准确率的要求,这样可以使得被试的注意力集中到观察数字上,从而使对于字母的注意力被分散出去。另外,每张卡片的呈现时间仅200毫秒,以便产生注意过载。这两项措施的目的在于激发自动加工。

图3-10 字母错觉实验用卡片
(来源:Treisman&Schmidt,1982)
结果表明,报告数字的正确率高于90%,而报告字母的正确率仅52%。在报告字母发生的错误中,有两种不同类型:特征错误和结合错误。特征错误是指被试报告出卡片上没有的特征,例如在呈现图3-10所示的卡片后,被试报告看到了“左面的黄的T”或“右面的蓝的O”。结合错误是指被试报告的特征没有无中生有的成分,但是位置发生交换,例如同样看到图3-10所示的卡片后,报告看到了“左面的粉红的T”或“中间的粉红的N”。在39%的试验中发现了结合错误——错觉性结合。
第二个实验称为字母同时匹配实验。实验中也向被试快速呈现一些卡片,也要求被试先报告两侧数字,然后报告有无形状颜色都相同的一对字母。图3-11是该实验的刺激卡片。由于a刺激卡中有一对形状和颜色都相同的字母(红色的X),d刺激卡中更有两对这样的字母(红色的X和蓝色的O),因而被试对这两张刺激卡报告“有”的比率应该比较高,而且d刺激卡应该比a刺激卡更高。而b、c、e这三张刺激卡中并不包含形状和颜色都相同的字母,但是如果产生错觉性结合错误,被试也可能报告“有”。而且,错觉性结合的概率取决于产生错觉的难度:b刺激卡中只要将红色X和蓝色O的颜色对换就可以产生错觉;c刺激卡中则必须同时将两个S的颜色换成红色,难度最高;e刺激卡中有两种途径可以产生错觉性结合,难度最低。这样就可以推断,被试对五种刺激卡报告“有”的比例应该是d>a>e>b>c。实验结果完全证明了这一推断。报告“有”的比例,分别是a:49.7%,b:25.4%,c:21.4%,d:74.7%,e:40.0%。这一实验结果同样证明错觉性结合的存在,而且排除了记忆和言语编码等非知觉因素的影响。

图3-11 字母同时匹配实验刺激卡片
(来源:Treisman&Schmidt,1982)
对于特征整合理论的反对意见
特征整合理论也不是人人都赞成的。邓肯和汉弗莱斯(Duncan&Humphreys,1989,1992)就提出相似性理论(similarity theory)来解释特雷斯曼的实验结果。他们认为,事情没有特雷斯曼所说的那么复杂。就视觉搜索实验的结果而言,完全可以简单地归结于目标刺激和分心刺激之间的相似性。两者之间的相似性越高,搜索就越难,反之就越容易。另外,分心刺激之间的相似性也会影响到搜索的难度。分心刺激越相似,搜索就越容易。而参与整合的特征的数量却不会影响搜索的速度。
凯夫和沃尔夫(Cave&Wolfe,1990)则提出了引导搜索模型(guided search model)。他们认为,任何搜索都包括两个阶段:第一阶段是平行加工阶段,这时个体根据对于目标刺激的特征的掌握,在头脑中激活一个心理表征,这个表征被称为“激活地图”,它标定各个位置存在目标刺激的可能性,这种表征在后面的加工阶段中将起到引导的作用;第二阶段是系列加工阶段,个体根据激活地图,按照可能性由高到低的原则,逐个评价被激活的要素,根据激活程度来选择真正的目标刺激。
特征分析理论的缺陷
特征分析理论也有一些缺陷。第一,特征的定义很难把握。作为一个特征,需要满足什么条件,没有操作性的说法。第二,先确认事物还是先确认特征?世界上有各种各样的事物,也就有无数的特征。如果是先确认特征,那么,在模式识别的初期,个体怎样确定应该检测哪些特征?如果个体事先知道应该检测哪些特征,那岂不是他早就知道自己面对的是什么事物?第三,特征分析阶段中的特征是怎样激活的呢?安德森(Anderson,1980)提出,每一个特征对应于一个“微型模板”,也就是说,特征激活的过程也是一种模式识别,而且是以模板匹配的方式进行的,这样一来,特征分析理论极力反对的模板匹配理论竟反过来成为它的组成部分。第四,模式识别不仅依赖特征信息,还受到周围背景以及个体知识经验的影响,这些单单用特征分析理论是难以解释的。