3.5.2 连通主义与翻译过程模式构建
20世纪80年代,认知科学对符号系统和信息加工假说的批评越来越多。这一时期,认知科学中出现了连通主义或平行分布处理(parallel distributed processing)的范式(Rumelhart et al. 1986)。这种理论范式借鉴大脑结构,试图为人类的认知提供一个功能性的解释。它将认知描述为神经网络中大量简单加工单元(神经元)的整体活动过程,将认知模拟为使用人工神经网络的模式识别;它提出了认知过程的平行分布加工模式或神经网络模式,主张认知过程在于类似神经元的、以网络形式分布的加工单位的激活力度的调整(Britannica Concise Encyclopedia 2008:374-375)4。其并行加工、亚符号分布式表征观对(作为跨语际表征)“思维语言”的假设和经典的符号主义局部表征观提出了挑战。
与客观主义的表征观不同,连通主义认为,不存在预先编程的符号和规则。我们并不是将知识作为单独的数据存储在某个地方,而是通过紧密相连的神经元之间的不同强度的连接来发展和激活模式。知识并不存在于单个神经元中,而是分布在整个网络中——因此是“并行分布加工”。连通主义认为,表征只是分布在大脑的神经网络中的“概念系统”的某种状态所导致的结果特征,是一种具有不同权重的“状态空间”(state space),发挥“引子”(attractors)的功能吸引系统着陆。简单说来,表征是一种复现的神经活动型式,但是不能有心智的、内在的和外在的本体上的划分。神经地图保留了世界中物体的关系和结构,似乎是外在现实的内在表征案例,但是对于具有视觉地图的有机体来说,它们是视觉经验的结构,不会再现任何事物,而只是神经激活型式,允许我们去体验我们所经历的,思考我们所思考的。我们可以将流动的经验抽象出来作为可以在过去和将来经历中例示的型式,但这不一定要导向表征主义观(Pederson & Nuyts 1997)。
连通主义承认某种表征状态,也认为认知是表征的演算,但反对核心程序观完全由上到下、纯功能主义的理性精神和其核心实现方式,主张允许从下向上的大脑工作方式。它否认S/S模式,否认计算是句法性的,主张以数值方式表征信息。在加工信息过程中,这些以数值方式表征的信息作为向量输入,经由一系列平行分布的互联单位,尤其是通过这些单位构成的互联网络——一个表征连通权重的矩阵,得到另一个向量作为输出。通过改变构成网络的连通效度值(efficacy),系统可以形成一种实施广泛领域的功能的构型,表现为向量–向量的映射。通过简单的实时系统学习,系统还可以通过尝试与犯错的方式解决问题,而不必明确每一步的程序。连通主义不但有学习性能优势,还具有生物合理性,即具有与神经元运作方式的相似性5。它认为大脑以平行方式运作,其演算程序是动态的、连续的,而不是线性的、离散的(Churchland 1986;McClelland & Rumelhart 1986)。所以计算机在这里也起着重要的作用,当然只是作为工具,并没有预设一个共性的演算算法;网络本身通过个体经验,利用可用的连接进行学习,以识别其环境中的规律。符号的含义是在亚符号层面的具体交互中积极学习的。情境的重复产生了相对的(个体的和文化的)稳定性,但意义仍然在不断变化的过程中。
连通主义为许多符号演算方法无法解释的翻译现象提供了解释。译者的大脑(犹如连接网络)也可以激活丰富的模式,并使用不同的解释来适应情景、文本和内部环境,即使在源文本意义不清楚、不确定的情况下也能处理。译者所在文化的特定知识和经验以及他们对目标群体的先前知识会影响他们翻译的方式。因此,连通主义者可以帮助我们解释译者思考情境的能力,将我们的解释建立在具体情境的关联性基础上,并将其限定在翻译过程中可以(重新)考虑到的信息范围之中。
连通主义给翻译的信息加工过程模式带来了一些新的认识。比如,吴义诚(2000)基于连通主义的并行(parallel)信息加工装置(即信息在神经网络上可以同时进行加工的理论),并结合实验对Bell的经典翻译过程模式(见下文)进行了批判,指出人类的信息加工在整体上是以串行方式进行的,但也包含平行加工的方式,有时是串行加工和平行加工的混合。他基于连通主义对Bell的翻译过程模式提出了修正性假设。
由于融入了学习机制,连通主义框架有望成为模拟翻译能力获得的正确方式。PACTE研究小组认为,翻译能力“被认为是一种新手知识的重组和发展过程,从译前能力的阶段(包括双语能力)开始,并逐渐通过新手、高级、胜任、熟练和专业的翻译阶段,成为一种专业知识形式”(Alves & Gonçalves 2007:47)。
需要特别指出的是,近年来,基于神经网络模拟的人工智能给翻译技术带来了巨大的进步。新的机器翻译软件、翻译技术的进步主要基于以下几个方面的转变:(1)对传统的规则演算模式的依赖降低;(2)统计机器翻译模式和大数据计算能力的提升。Brown et al. (1990:79)在论文中提出了统计机器翻译(SMT)模式,即“一种语言中的每个句子都是另一种语言的任何句子的可能翻译”,翻译者可为给定的源语言的句子产生各种不同的目标句子,而用一个数学框架给不同的目标句分配(假设的)概率(Brown et al. 1993)。(3)基于神经网络的学习智能。神经机器翻译系统(Neural Machine Translation,简称NMT)是一种用于自动翻译的端到端的学习方法,该方法有望克服传统的基于短语规则的翻译系统的缺点。谷歌神经翻译系统(GNMT)6基于连通主义的框架,在推理计算过程中使用低精度运算——可以先将低概率选项纳入,然后结合前后语境选择,从而提高对语境的适应性——让解码器重点注意与生成目标词最相关的编码的源语词向量的权重分布,并基于大数据对NMT系统进行训练,从而大大提升了系统的整体准确度。
依托大数据,机器翻译技术从主要基于规则模式转变为主要基于神经网络模式,其对多变的翻译语言语境的适应性也越来越强。