阅读

2026年07月27日

版权

阅读

阅读是从书面文句中提取意义的过程，这个过程既是自下而上的又是自上而下的，两个方向的加工相互作用，才产生有效的阅读。

词的识别

词是标志事物的约定俗成的符号。前面讲，语言是一种符号系统，基本上是由词的符号作用来体现的。对于词的识别（这里单讲书面单词的识别）是根据词形及其上下文，在心理词典中找到相应的条目，从而了解它的意义，这就是词汇通达（lexical access）。

研究词的识别有很多方法。最简单的是词汇判断任务：向被试呈现一串字母，这些字母有的构成一个词（例如DOG），有的不是词（即非词，相当于无意义音节，例如DOP），被试的任务是尽可能又快又准确地判断呈现的是词还是非词。其反应时和错误率就是单词识别的效率指标，这样就可以测定各种因素对于单词识别的影响。

命名作业也是研究词的识别的重要方法。命名就是让被试朗读一个词，并记录从呈现词到被试发出声音之间的反应时。这种方法比较接近正常阅读的情况，因此经常得到运用，但是它不容易排除语音的作用。遇到反应慢、口齿不清的被试，反应时数据不够准确，何况正常阅读往往是默读而不是朗读。

还有一种方法称为语义分类作业：在实验中，要求被试判断呈现的词是不是属于先前规定的某个类别。例如，规定语义类别为“花”，呈现“郁金香”时，被试应作出肯定回答；呈现“鼠标”时，应作出否定回答。

奥康纳和福斯特（O'Connor＆Forster，1981）对词频与单词识别的关系所做的一个研究表明，高频词中细微的拼写错误不容易被发现。例如将高频词MOTHER拼写成MOHTER，较多的被试还是会将其错判为词；相比之下，BOTHER被错拼为BOHTER后，较多的被试判断其为非词。

另外，用命名作业进行实验也发现，词频能影响命名的反应时：读低频词之前停顿的时间长，高频词前时间短。在控制单词长度的情况下，被试阅读常用词比阅读非常用词所需的注视时间短。

词的启动效应也是词的识别研究的一个重要领域。前面出现过的单词对后面出现的相同单词有促进作用，这就是一种直接启动，又称为重复启动效应。本书在第3章“知觉”中曾详细介绍了启动效应研究，读者可以参考前文。

关于词的识别，有多个理论或模型。最早的是莫顿（Morton，1969）提出的单词产生器模型（logogen model）。这个模型认为，单词产生器的工作原理是进行加法运算，计算信息的总量。而这里所谓的信息，既包括视觉的词形信息、听觉的语音信息，也包括上下文提供的语义信息。每输入一项信息，单词产生器的计数值都会增加，当累加的值超过了阈限，就产生反应。如果累加的信息没有使累加值达到阈限，就通过复述暂时保持在记忆中。常用词的阈限低，故容易激活；使用频率低的单词阈限高，激活比较困难。

此外，福斯特（Forster，1976）提出了词汇通达的搜索模型（search model of lexical access）。该模型的主要思想是，输入的感觉信息和一个内部词典中的某个词条之间产生适当的匹配，就产生单词的识别。该模型同样考虑到词的感觉输入包括视觉和听觉两种基本形式，并分别建构了两种表征形式作为对应：视觉信息对应于正字法通达文件，听觉信息对应于语音通达文件。这两个“文件”并不是真正的文件，可以看作是信息的两种表征。正字法通达文件或语音通达文件进入内部心理词典或“主文件”。单词识别过程就是根据感觉输入在上述通达文件中进行搜索的过程：如果通达文件中词汇的表征与感觉输入之间产生适当的匹配，就意味着通达文件中搜索到了对应的单词；然后再将最初的刺激或其在工作记忆中的表征来检验这个单词的完整拼写，如果匹配，就识别出这个单词，否则就要在通达文件中重新搜索。

福斯特提出，由于词典容量很大，序列搜索费时较多，无法满足阅读速度上的要求。为此，可以先将单词分成许多个子集（又称“箱子”），在搜索开始前通过某种方式选定一个箱子进行搜索，就可以提高效率。各个单词在搜索空间中的位置受到其使用频度和近期重复情况的影响，高频词或近期用过的词排在靠前的位置。

麦克莱兰和鲁梅尔哈特（McClelland＆Rumelhart，1981；Rumelhart＆McClelland，1982）提出了一个对后来研究产生重大影响的交互作用模型。他们认为，单词识别是在自下而上加工和自上而下加工的交互作用下完成的。

交互作用模型认为，单词的加工单元从最底层到最高层分为视觉特征单元、字母单元、词单元等。视觉呈现的字符串首先激活有关的视觉特征单元，然后激活一定的字母单元，最终激活词单元。某一单元的激活可以抑制同一层次其他单元的活动，从而更快地产生分辨。例如，单词house激活后，近似的单词horse或mouse就受到抑制，这样house就得到了识别。

句子的理解

句子是表达一个完整意思的符合一定语法特征的最基本的语言单位，句子的理解是一个认知过程，在这个过程中，阅读者根据书面文句中的各个成分和语法特征，建构出一种解释或意义。换句话说，阅读就是根据文句的表层结构来建构其意义。

意义可以用一系列的命题来表示。例如，句子“惊慌的男孩赶走抓他的猫”可以分解为以下三个命题：

猫抓男孩。

男孩是惊慌的。

男孩赶走猫。

比较英语和汉语文句，我们可以发现，英语多长句，汉语多短句。在将英语翻译成汉语时，常常将英语长句断开，形成几个短句。而短句更接近命题。从这个意义上讲，汉语文句更容易理解，汉语也更容易掌握。

泰勒和泰勒（Taylor＆Taylor，1983）调查了181个子句，10个段落（每个段落包括150个单词），统计其中不同类型句子的出现频率。虽然调查的语料较少，但是仍然得到了一些倾向性的结果：在英语中最常出现的句子是基本句、被动句和否定句（见表11-1）。

表11-1　不同结构英语句子的相对使用频度

（来源：Taylor＆Taylor，1983）

一般来说，否定句比陈述句复杂，因为否定之后还需要弄清应该肯定的是什么。例如，“我没有说过这句话”的意思可能是我说了句别的话，或者是别人说了这句话，或者我不是说而是写了这句话，等等。如果后面补充一句话“这话是小王说的”，意思才完全明确。

在英语中大量使用被动语态，尤其是英语的科技文章中。但是，被动句在理解、学习和产生上都比主动句困难。人们在回忆被动句的时候，也常常将其回忆成主动句。汉语和英语不同，较少采用被动语态，这就降低了汉语文句的理解难度。

句子理解的最终结果是句子的意义表征，而不是句子本身。例如，贾维拉（Jarvella，1971）在一个研究中采用了这样两段话作为听觉刺激材料：

With this possibility，Taylor left the capital.After he had returned to Manhattan，he explained the offer to his wife.

Taylor did not reach a decision until after he had returned to Manhattan.He explained the offer to his wife.

在这两段话中，“after he had returned to Manhattan”这个从句所处的位置是相同的，只是在第一段话中，它属于第二个句子；在第二段话中，它属于第一个句子。实验的结果是，被试在回忆两段话时，首尾的内容都是相似的，都是段首的回忆成绩差，段尾（he explained the offer to his wife）回忆成绩好。这还是容易理解的，因为段尾的内容还存留在工作记忆当中。照此继续推理下去，居于中间位置的上述从句的回忆成绩原本应该是介于首尾内容之间，而且两种情况下的成绩应该比较接近，但是结果表明，听到第一段话的被试对于“after he had returned to Manhattan”这个从句的回忆正确率为大约54%，听到第二段话的被试对该从句的回忆正确率仅为20%。贾维拉认为，在听第一段话的情况下，该从句听完后，整个句子还没有全部结束，该从句还在受到加工，因而回忆句子时还处于工作记忆中；而在听第二段话的情况下，该从句听完后，它所在的句子就结束了，回忆句子时该从句已经不在工作记忆中了。可见，句子理解的最终结果是解读其意义，而不是存储句子的外在表述形式。

歧义处理也是句子理解时可能遇到的问题。不过，在一般文句的理解中几乎不会意识到歧义现象，除了一些专门用来“修理”读者的歧径句（garden path sentences）。例如，加勒特（Garrett，1990）列举了下面几个英文句子：

Fatty weighed 350 pounds of grapes.

The cotton shirts are made from comes from Arizona.The horse raced past the barn fell.(https://www.daowen.com)

上述句子的共同特点是，当读到句子中间或末尾的时候，读者会发现对前面部分的理解根本就是错的。例如，对于第一个句子，一开始的理解是Fatty重达350磅，读到最后一个词，才知道是Fatty称了350磅葡萄。对于这样的句子，不宜急于判断句子结构，而是待句子读完后再加以分析，这称为“晚终止策略”。

上述歧径句在阅读中倒也不很常见，作者一般不敢频频使用这种修理读者的手法。但是另一种歧义现象却是很常见的，那就是由于多义词（尤其是义项差别很大的多义词）造成的歧义。这种歧义往往能根据上下文轻松解决。不过，心理学家还是细致地研究了人们处理歧义的某些细节。其中一个重要的研究是斯温尼（Swinney，1979）的词汇通达实验。在这个实验中，斯温尼向被试听觉呈现一些成对的语段，每对语段的用词基本相同，唯一的区别在于一个语段在特定位置用了一个歧义单词，另一语段在此位置用了一个不会产生歧义的单词。例如下面成对的两段话中，bug是一个歧义单词，可以解释为“昆虫”，也可以解释为“窃听器”。而insect专指“昆虫”，无歧义问题。

Rumor had it that，for years，the government building had been plagued with problems.The man was not surprised when he found several roaches，spiders，and other bugs*in the corner of his room.

Rumor had it that，for years，the government building had been plagued with problems.The man was not surprised when he found several roaches，spiders，and other insects*in the corner of his room.

在被试听句子的同时，还要完成一个视觉词汇决策任务——尽可能迅速地判断一个字符串是不是一个英文单词。字符串在被试听到上述语段的“*”（即出现歧义单词或非歧义单词）处呈现。这实际上是一个启动效应实验，考察的是被试听到歧义单词能否同时激活它的多个不同义项。例如，bug的两个义项（“昆虫”和“窃听器”）能否同时得到激活？

结果发现，bug的两个义项在被试听到这个单词之后同时得到了激活，其依据是在视觉词汇决策任务中，分别与上述两个义项有关的单词ant（蚂蚁）和spy（间谍）都得到了启动，不过前提是它们要在“*”后立即呈现；如果呈现时间延迟到4个音节或以上，则只有ant得到启动。在英语中，4个音节的时间大约在750～1 000毫秒之间。可见，被试在刚听到bug时，两个义项都得到激活，而在4个音节以后再呈现，则只能通达“昆虫”这个义项了。

在本书第3章“知觉”中，曾提到马塞尔关于启动效应的研究，与这个实验相映成趣，读者可以前后参看、比较。

语段的理解

语段指的是由若干个前后连贯的句子组成的语言段落。对于语段的理解不仅要以对词和句子的理解为基础，又要加工句子间的相互关系，是更加复杂的认知过程。

语段理解当然与语段中的语意因素有关。金奇和基南（Kintsch＆Keenan，1973）指出，句子中命题的复杂性对于阅读的效率有重要影响。他们在实验中向被试呈现句子或语段，被试在默读完句子或语段后立即按键并回忆刚才读到的内容。结果发现，长度相同的两段话，包含较多命题的所需的阅读时间要长一些（见图11-4）。另外，被试容易回忆出来的也是那些比较“中心”的命题（即那些与句子的主旨有关的命题），而不是那些用来修饰“中心命题”的“边缘命题”。这说明，命题的心理表征可能也是分层次的：“中心命题”位于顶部，最容易提取到。

图11-4　命题数与阅读用时的关系

（来源：Kintsch＆Keenan，1973）

后来，金奇和范迪克（Kintsch＆van Dijk，1978）提出了一个关于语段理解的模型。这个模型的基本观点是：（1）理解是指读者对文件提供的信息建构某种心理表征；（2）命题是话语的基本结构单元，一个句子可以表示一个命题，也可以表示多个命题；（3）理解中的建构指的是建立某种命题网络；（4）话语加工具有周期性，即由于工作记忆容量是有限的，每个加工周期中只有一些最重要的命题被保存在工作记忆中，它们的作用就是将前面的课文和现在输入的信息联系起来；各个加工周期中，保存在工作记忆中的命题也是不同的。

贾斯特和卡彭特（Just＆Carpenter，1987）开展了一系列关于阅读中的眼动特点的研究。他们发现，阅读过程中，被试的注视点在文字间不断地停顿和跳跃，每次停顿的时间平均在250毫秒，每次跳跃的时间大约是10～20毫秒。另外，影响注视时间的因素很多，包括词的长度、词的使用频度、异常情况，以及词的性质——注视实词的时间比虚词长。下面列出的就是一位被试在阅读一段文字时，各个单词得到的注视时间（毫秒）：

（来源：Just＆Carpenter，1987）

贾斯特和卡彭特还提出，阅读过程就是对看到的单词加以解释，赋予其角色。阅读时，每一个单词得到解释都发生在它们受到注视的期间，这就是眼-心假设（eye-mind hypothesis）。因此，注视时间的长短就可以作为被注视内容的加工难度的指标。

哈维兰和克拉克（Haviland＆Clark，1974；Clark＆Clark，1977）则提出了阅读的“已知-新信息策略”（given-new strategy）。他们认为，任何一个句子都包含已知的信息和新的信息，阅读就是将两者联系起来，从而达到理解。在说话时，可以用重音来突出需要注意的新信息，在书面语中，则可以用特定的句式来区分已知的信息和新的信息（见表11-2）。

正是由于句子中有新旧两种信息，一个语段就成为已知信息引出新信息——新信息成为已知信息——已知信息引出更新信息这样一个功能体，从而表达一段相对完整的意思。

表11-2　句子中的已知-新信息

（来源：Haviland＆Clark，1974）

已知信息和新信息之间应该有某种联结方式，那就是前后句子中有共同的元素。例如下面这个语段的两个句子中（Haviland＆Clark，1974），单词beer就是承前启后的共同元素。

We got some beer out of the car.The beer was warm.

（我们从车里取出一些啤酒。啤酒还是温的。）

第一个beer被称为先行词（antecedent）。在看完或听完第一句时，beer被储存在工作记忆中，当看到或听到第二句的beer时，两者就能联系起来，“The beer was warm.”就容易理解。如果换一种说法：

We checked the picnic supplies.The beer was warm.

（我们检查了野炊物资。啤酒还是温的。）

被试在看到或听到第二句话时就觉得beer仿佛是凭空出现的，两句话难以联系起来。这时必须有一个联结推理（bridging inference），即考虑野炊和啤酒的关系，推出“野炊物资中包括啤酒”这一信息，然后才能顺利地理解这个语段。

布兰斯福德和约翰逊（Bransford＆Johnson，1972）的研究更是体现了图式对于阅读的重要意义。他们编写了一些含义模糊的语段，被试虽然一开始很难明白这些内容，但是如果告诉他们相关的图式或脚本，被试就恍然大悟。其中一个模糊语段是这样的：

这个程序实际上是极其简单的。首先，你要将东西分组。当然，分成一组也够了，就看有多少要做。如果由于缺少设施，你必须到别处去，那是下一步，否则你会一切顺利。重要的是不要做得太多。这就是说，一次少做些比做太多要好。这在短时期内似乎不重要，但是容易产生麻烦。一个错误的代价同样是很高的。首先，整个手续会复杂起来。但它很快就会成为生活的另一方面。很难预见这种任务的必要性在不远的将来能够终结，而且没有人能这样说。在这个程序完成以后，你要再次将东西分组，然后将它们放在合适的地方。终究它们要被再次使用，而且这是一个必将得到重复的周期性活动。无论怎样，这是生活的一部分。

（译文采自王甦和汪安圣的《认知心理学》1992年版第353页，部分措辞有技术性修改）

如果加上标题“洗衣服”，上述语段就容易理解得多。