工作记忆的定义和组成部分
巴德利(Baddeley,2000)对工作记忆下的定义是:工作记忆是一个容量有限的系统,它用于暂时储存信息和操纵加工信息,以便完成复杂的任务,例如理解、学习和推理。可见,巴德利在承认工作记忆储存信息的作用的同时,还十分强调它对信息的操纵和加工的作用。(https://www.daowen.com)
在最早的版本中,工作记忆包括三个组成部分:中央执行机构(central executive)、语音环路(phonological loop)和视觉空间展板(visuospatial sketch pad)。三者之间的关系如图4-12所示。

图4-12 工作记忆三成分示意图
(来源:Baddeley,2000)
中央执行机构是工作记忆的中枢系统,它负责控制和引导信息的流动,并通过注意的集中和转移来协调语音环路和视觉空间展板的活动;它还负责当前环境的输入与过去经验之间的协调工作,使得个体能够甄别见解或形成策略。中央执行机构的工作不需要占用很多的资源。巴德利(Baddeley,1993)将这种协调功能看作是意识。语音环路负责保持言语和听觉信息,它又包括两个组成部分:储存部——保持记忆痕迹的仓库;复述部——负责复述信息、刷新记忆痕迹的部门,如果没有复述部的工作,记忆痕迹将在2秒左右消失。最后,视觉空间展板负责保持视觉和空间信息。语音环路和视觉空间展板都受到中央执行机构的制约。
语音环路
语音环路具有十分明显的言语相关性。这一特性体现在音近效应(phonological similarity effect)、词长效应(word-length effect)和听觉抑制(articulatory suppression)等现象中。
音近效应是指在字母或单词发音接近的情况下产生的记忆混淆。康拉德关于听觉编码的理论就是根据字母的音近效应提出来的。下面是一个单词的音近效应的例子。以较慢的速度朗读以下单词系列(A),读完后视线离开单词并从1数到15,然后默写。
单词系列(A):mac,can,cap,man,map
接下来,用同样的程序完成单词系列(B)的朗读和默写。
单词系列(B):pen,pay,cow,bar,rig
结果表明,对于单词系列(A),被试容易将其中的单词混淆,因为它们都是发音比较接近的单词;而对于单词系列(B)则没有这个问题。
词长效应是指长度较短的单词比长度较长的单词容易记忆。例如,同样是按照刚才的程序朗读和默写下面两个单词系列,可以发现单词系列(A)比单词系列(B)更容易记住。图4-13是巴德利等人(Baddeley,Lewis&Vallar,1984)的实验结果。

图4-13 词长效应实验结果
(来源:Baddeley,Lewis&Vallar,1984)
单词系列(A):beast,bronze,wife,golf,inn,limp,dirt,star
单词系列(B):alcohol,property,amplifier,officer,gallery,mosquito,orchestra,bricklayer
产生词长效应的原因是长单词占用了语音环路中更多的容量,减弱了复述机制的作用。埃利斯和亨内利(Ellis&Hennelly,1980)认为,美国儿童的短时记忆广度长于威尔士儿童,不是因为美国儿童更加聪明,而是因为威尔士的数词比较长(un,dau,tri,pedwar,oump,chwech...)。
听觉抑制指的是在听单词时无关声音对其效果的破坏。例如,在听觉上分别呈现下面两个单词系列,同时让被试不断发出单词“the”的声音,然后回忆单词。结果发现,在这种情况下,被试对这两个系列的单词的回忆成绩都会下降,而且原来应该发生的词长效应也会受到抑制。
单词系列(A):automobile,mathematics,apartment,syllogism,basketball,Catholicism
单词系列(B):story,ant,towel,car,coffee,swing
巴德利认为,尽管被试发出的是“the”的声音,但是其他单词也会进入语音环路,这时,音近效应可能发挥作用,从而损害作业的成绩。如果两个单词系列采用视觉呈现,听觉抑制就会消除。
视觉空间展板
虽然短时记忆主要以听觉编码为主,但是视觉空间展板也起着不小的作用。布鲁克斯(Brooks,1968)关于反应依存注意的实验充分体现出这种作用。在其中一个实验中,要求被试先识记一个句子,例如“John ran to the store to buy some oranges.”或“The bird flew out the window to the tree.”;然后依次指出句子中的每一个单词是不是名词。指出是不是名词的反应在两种任务(条件)下进行:第一种任务就是口头报告(Yes/No);第二种任务是动作指点,即在视觉呈现的一系列“Y”和“N”中指出他想说的字母。如图4-14(a),如果被试想说第一个单词是名词,就在第一行中指向Y;接着,如果想说第二个单词不是名词,就在第二行中指出N;再下一个单词依此类推。结果发现,被试进行口头报告比动作指点更加困难一些。
布鲁克斯的另一个实验也包括两种任务。第一种任务是,向被试呈现一个如图4-14(b)所示的字母,然后从左上角的星号开始,依次想象(不是注视着原来的刺激)并口头报告每个角是不是外角,也是用“Y”和“N”作出反应。第二种任务也是对着视觉呈现的一系列“Y”和“N”中指出他想说的字母。结果,这次被试进行口头报告(Yes/No)时更加容易一些。
布鲁克斯的实验说明,被试的反应类型(口头报告还是动作指点)对反应是有一定影响的。而且,当刺激是言语性的情况下,与视觉空间有关的动作指点任务比较容易;在刺激带有视觉空间属性的情况下,与言语有关的口头报告比较容易。用工作记忆理论来解释,那就是口头报告依赖语音环路,动作指点依赖视觉空间展板。因此,刺激和反应属于同一类型的时候,反应就会困难些。

图4-14 反应依存注意示意图
(来源:Brooks,1968)
从上述实验也可以看出,语音环路和视觉空间展板是相对独立起作用的,这使得个体能够处理同时呈现的言语信息和视觉空间信息。
中央执行机构和情景缓冲器
中央执行机构执行些什么呢?巴德利(Baddeley,1996)将中央执行功能分解为4个方面。第一是集中注意;第二是在有多个目标需要注意时,由其对注意加以分配;第三是在多个目标的情况下进行目标转换;第四是将工作记忆与长时记忆联系起来。巴德利开始时认为,中央执行机构不应该存储信息,但是这一假设遇到了很多问题,从而导致了第四个组成部分——情景缓冲器(episodic buffer)的提出。
很多针对工作记忆的实验结果难以用三成分模型作出合理的解释。其中最重要的一个结果是,工作记忆所能储存的信息似乎大于语音环路和视觉空间展板的总和。如果认为中央执行机构也有一定的储存信息的能力,似乎与其功能不符。于是,巴德利(Baddeley,2000)提出了一个新成分——情景缓冲器。这是一种可以使用多种形态编码的信息储存系统,其储存的信息通常是情景性的;而且,它可以将视觉空间展板、语音环路以及长时记忆中的信息整合起来,作为一种场景或者情景进行储存。
这样,三成分模型就发展成四成分模型(见图4-15)。该模型分为三个层次,第一层中央执行机构,完成最高级的控制过程;第二层是工作记忆的储存区,包括视觉空间展板、情景缓冲器和语音环路;第三层是长时记忆系统,包括视觉语义、情节长时记忆和语言。工作记忆属于流体系统(fluid systems),它们本身不能直接通过学习改变;长时记忆属于晶体系统(crystallized systems),它能够积累长时知识。

图4-15 工作记忆四成分示意图
(来源:Baddeley,2000)
普拉巴卡兰等人(Prabhakaran et al.,2000)的研究为情景缓冲器提供了神经科学方面的证据。他们发现,在记忆任务中,如果要求将词语与位置绑定,右侧前额叶显示出特异性激活。这说明存在着一个独立于视觉空间展板和语音环路的工作记忆成分,即情景缓冲器。
在对工作记忆理论的展望中,巴德利(Baddeley,2012)甚至设想提出了一个能更广泛解释认知现象的工作记忆模型,而且情景缓冲器在其中的地位甚至可能高于视觉空间展板和语音环路(见图4-16)。

图4-16 工作记忆模型设想