模板匹配理论
模板匹配理论的基本思想
最容易想到的,也许就是通过模板的比较来进行模式识别,就好像我们拿着事先印好的照片,找出照片上的人。这种理论就是模板匹配理论(template-matching theory),其基本观点就是,不同事物在个体的头脑中存在着对应的模板,当个体面对着一个未知的刺激模式时,他就将这个刺激模式与头脑中的模板一一比较,找出匹配程度最高的那个模板,从而完成模式识别。
以字母识别为例,如果一个字母A出现在个体面前,它反射出的光线通过瞳孔和晶状体,在个体的视网膜形成一个网膜像。这个映象经由视神经传向大脑,在那里进行译码。当网膜像激活的细胞与字母A的模板指定的网膜细胞一一对应时,个体就能判定自己看到了字母A。如果输入的刺激与模板在大小、方向、字体上不完全吻合,视觉系统就会将输入的信息加以“标准化”,然后进行模板的匹配。如果找不到合适的模板,该模式就被当成是一个未知的模式,通过学习,建立起表征这种新模式的模板,以便以后的模式识别。
模板匹配理论的一个重要的理论意义,就是确认了在人的头脑中应该存在与各种刺激模式相对应的表征。在实际生活中,模板匹配理论也得到了一定的应用,计算机就采用这个理论进行文字识别。条形码就是最早成功的例子。计算机通过光学设备将条形码输入后进行模板匹配,然后转换成数字。后来采用同样的办法,可以直接对标准的阿拉伯数字和其他文字进行光学识别。
模板匹配理论的缺陷
但是,如果头脑中的表征真的是像照片那样简单的模板,就不能解释这样一个问题:为什么采用了模板匹配算法的计算机不能像人类那样灵活地识别各种形状差异很大的相同刺激?以汉字光学识别为例,每一个汉字都需要模板,由于字体不同,还需要无数个模板,才能帮助计算机识别从宋体、楷体直到行书和草书的不同变式,但是计算机尚不能储存如此巨量的模板,因此只能较好地识别一些常见的印刷字体,例如宋体、楷体等,而对手写的字体,尤其是行书和草书等字体,因为模板的缺乏,就很难识别;而且,模板越多,匹配所花的时间也会越长,故文字识别的效率还会随着模板的增加降低。而人类的情况正好相反:人在识字的时候学的是印刷体和老师比较工整的手写体,但是以后看到别人写行书甚至草书的时候,他也能比较快地识别出来,不需要重新学习识字,也不会随着识字量的增加,识别的效率越来越慢。
还有一个更重要的问题是,人的知觉还有一定的概括性,即使对于差别很大的事物,我们有时也会把它们看作是同一个事物。例如,我们看到十多年不见的老友,尽管双方都发生了很大变化,却能很快彼此相认。这是模板匹配理论无论如何也解释不通的。
模板匹配理论虽然被心理学家几乎一致地认为不能很好地解释人类的模式识别过程,但是,作为模式识别的一个方面或环节,模板匹配还是有一定的作用,不应完全加以否定。在后来提出的模式识别模型中,也不能完全避开模板匹配这种机制。