成分识别理论
成分识别理论的基本思想
成分识别理论(recognition by components theory)可以看作是特征分析理论的进一步延伸,是由比德曼(Biederman,1987)提出的。这个理论吸取了特征分析理论和格式塔理论关于知觉组织的合理成分,提出了几何离子(geometrical ion或geon)的概念,因而得到广泛的关注。比德曼提出,任何几何图形都可以分解成一些简单的成分,即几何离子。当人们看到面前的物体时,就将这个物体具有的几何离子及其相互关系与长时记忆中已经储存的表征进行匹配,从而完成模式识别。这种匹配是自动化的,速度很快,而且抗错性很强。
几何离子是由一些边界联合组成的,有的像锥体,有的像圆柱体(见图3-12)。比德曼的理论中包含36种几何离子,它们之间可以产生108种关系(例如“在上”“旁接”“大于”等)。这些几何离子按照一定的关系组织起来,理论上可以产生几乎是无数种可能的物体(见图3-13和图3-14)。

图3-12 部分几何离子
(来源:Biederman,1987)

图3-13 由几何离子构成的假想物体
(来源:Biederman,1987)

图3-14 由相同的几何离子按照不同的关系构成的不同物体(https://www.daowen.com)
(来源:Biederman,1987)
成分识别理论的实验验证
比德曼等人用物体命名实验验证自己的理论。在一个实验中,要求被试对不同几何离子组成的图形进行命名。组成图形的几何离子数目有3个、4个或6个。实验中共呈现36种图形,呈现时间为每幅图片100毫秒。结果发现,组成图形的几何离子数目越多,被试命名反应的速度就越快,精确性也越高,但是变化幅度并不很大。这说明,少数关键的几何离子就足以帮助被试识别物体。
在另一个实验中,比德曼(Biederman,1985,1987,1990)设计了两种不同的图片让被试识别。这两种图片都是将完整物体图形加以衰减,即去除部分线条。两种图片的区别在于,第一种图片保留了物体轮廓线上的接合点和端点,而第二种图片上的轮廓线没有接合点和端点(见图3-15,其中的a图形都有接合点和端点,b图形没有)。图片的呈现时间都是100毫秒。结果发现,有接合点和端点的图形比较容易辨认,正确率约为70%;而对于擦除了接合点和端点的图片,被试辨认的正确率降低到约50%。在格式塔心理学中,相连的成分或无间隙的成分容易被看作是一个整体,这就是连续性原则(principle of continuation)和间隙填充原则(principle of filling)。比德曼的这一发现与格式塔的原则不谋而合。

图3-15 对衰减物体的辨别
(来源:Biederman,1987)
由于成分识别理论列出了数量有限的几何离子及其相互关系,容易被移植到计算机模式识别软件中,因此在计算机视觉领域也得到一定的应用,甚至有人试图将其运用到汉字识别中。
成分识别理论的缺陷
比德曼本人也承认,成分识别理论有严重的缺陷。他(Biederman,1990)认为,如何更好地描述物体各组成成分之间的关系,仍是一个值得进一步探讨的课题。另外,成分识别理论和模板匹配理论、特征分析理论一样,都重视自下而上的加工,缺乏对自上而下的加工的研究,从而很难解释个体的知识经验、愿望、动机以及环境背景对模式识别的影响。