《翻译质量评价的标准与自动评价方法研究》简介
《翻译质量评价的标准与自动评价方法研究》这本书是由秦颖著创作的,《翻译质量评价的标准与自动评价方法研究》共有79章节
1
扉页
...
2
目录
...
3
序言 荀恩东
翻译承载着不同语言和文化之间沟通交流的使命。翻译的基本要求是实现不同语言形式下的语义等价转换。然而如何评判翻译结果的优与劣?怎样评价更客观,可信度更高?是否存在...
4
前言
语言是人类活动中最复杂的一项活动。我们每个人都能运用母语交流思想、互通信息、学习技能。和语言信息处理打交道了十几年,我深深地感悟到,其实语言是时空中的一个“活物...
5
第1章 绪论
翻译(translation)“很可能是宇宙进化过程中迄今为止人类最复杂的一项活动”(I. A. Richards,1953)。翻译是源语言(source,又称...
6
第2章 翻译的观点和质量评价标准
国内外对翻译理论和实践的讨论由来已久,从未间断,产生了很多不同的思想观点和流派。对于同一篇原文,不存在唯一确定的、最完美的翻译。不考虑机器翻译的话,译文能够体现...
7
2.1 系统功能语言学视角下的翻译评价
一、翻译观 系统功能语言学作为语言学的主要流派之一,对语言本质进行了深入的揭示,对于翻译的本质、翻译标准和翻译过程都产生了深远的影响。许多学者基于功能语言学角度...
8
2.2 专家评价与众包评价
人工评价译文质量,通常情况下要求评价者拥有较高的语言水平,尤其是要洞悉翻译中涉及的两种语言和相应的背景知识,有时甚至要求语言水平高于译者水平的人才能去评价译文的...
9
2.2.1 专家评价的标准
专家评价方式常见于专业教师对学习者翻译作业的批改、翻译考试、语言专家对机器译文的评估等方面。专家评价一般也要先制定相应的译文质量评价标准。专家依据标准,通过对原...
10
2.2.2 人工评价的影响因素
译文质量人工评价中,评价者的评价态度、理解能力、语言素质(包括语言能力、语言知识)等诸多因素都会影响到评价结果。译文质量评价是一项主观性很强的工作:译文是否忠实...
11
2.2.3 衡量人工评价结果的指标
评价的内部一致性(intra agreement)和外部一致性(inter agreement)用于衡量人工评价译文质量的信度和可靠性。内部一致性指的是同一个评...
12
2.2.4 众包评价
一、众包方式简介 首先介绍众包(crowd sourcing)的概念。维基百科中对众包的定义是一种分布式的问题解决和生产模式。将一项的任务分解后置于计算机网络平...
13
2.3 宏观评价与诊断评价
译文质量评价中评价的粒度有多种情况,目前大致可分为宏观评价与诊断评价两类。宏观评价和诊断评价在评价的代价、方法、适用面等多方面各有特点。...
14
2.3.1 宏观评价的特点
宏观评价就是评价者通过对译文的阅读,并参照原文,对待评译文进行一个整体的质量估计,给以一个实数分数或是质量档次的评价结果,也就是评分。宏观评价不要求指出译文存在...
15
2.3.2 诊断评价的特点
诊断评价也称分析性评价。诊断评价多见于语言学习者日常翻译训练,在机器翻译领域的评价中开展得很少。人工诊断评价的角度涉及译文的很多方面,比如语法形式是否正确、语义...
16
2.4 层次化的翻译评价体系
宏观评价和诊断评价各有特点和优势,实际应用中,对译文评价的需求是多方面的,也是多变的。有时既需要从宏观评价中得到一个整体的质量区分度,又需要了解译文在哪些方面存...
17
2.5 小结
本章对评价翻译质量的标准和粒度方面进行了讨论,包括功能语言学视角下的翻译和翻译评价观点,介绍了专业人士对评价译文质量的不同标准,既有针对语言学习者的,又有针对机...
18
第3章 译文质量自动评价方法
译文质量的人工评价是传统的衡量译文质量优劣的方式。近年来译文质量自动评价研究得到充分的重视,研究的驱动力来自机器翻译研究的蓬勃发展。在系统研发过程中,需要不断评...
19
3.1 依赖参考译文的评价
参考译文(reference translation)是这一类评价方式的基础条件。参考译文一般由专业人士给出,对机器而言,人工参考译文就是要达到的翻译样本。依赖...
20
3.1.1 基于n-gram的相似度
一、BLEU算法 BLEU即BiLingual Evaluation Understudy的缩写,是翻译自动评价中最经典的算法(Papineni et al.,...
21
3.1.2 基于图的n-gram最大匹配
基于n-gram的评测算法中,较大的n-gram共现的机会很小,因此会对n实施限定,从而不能发现较长n-gram的匹配。GTM(Generative Topog...
22
3.1.3 基于词汇错误率的评价
检查待评译文的错误率也是评价其翻译质量的方法之一。常用的错误率主要包括词汇错误率(Word Error Rate,WER)、位置无关错误率(Positionin...
23
3.1.4 译后编辑率
机器译文目前在一定程度上可用,或部分译文可直接采用,还有一部分需要人工修改后可用。这样,译后编辑率就成为衡量机器译文质量的一个指标。通过计算对译文进行后期编辑要...
24
3.1.5 基于词汇语义的相似度
基于词汇相似的评测中最有代表性的是METEOR算法,其主要思想是统计待评译文和参考译文的词汇相似度,并能够利用Wordnet等外部资源增加同义和近义词的匹配几率...
25
3.1.6 基于依存元组的相似度
n-gram一般指句子中连续n个词构成的序列。基于n-gram匹配的方法并不能真正从语义层面反映出待评译文与参考译文的相似度,而且包含了大量无明确语义的元组,像...
26
3.1.7 深度语言分析评价
要深入评价译文质量,首要是对译文进行较多的语法或语义层面的分析,因此深度语言分析的评价方法从句法结构(syntactic structure)、重述、近义(sy...
27
3.1.8 基于抽象语义表示的评价
近年来,深度学习(deep learning)在图像和语音等领域大获成功后,计算语言学研究也纷纷转向神经网络的方法。深度学习成为最有影响力的关键词之一。Chri...
28
3.1.9 神经网络学习的应用
按照神经生理学突触修正学派的观点,人脑的学习和记忆过程实际上是一个在训练中完成的突触连接权值的修正和稳定过程。其中,学习表现为突触连接权值的修正,记忆则表现为突...
29
3.1.10 多篇参考译文的作用
在基于参考译文的评价方式中,还有一个被普遍忽略的问题:由于针对同一原文的合理译文是多样的,并没有唯一确定的译法。多种译法在词汇选择、句子结构等多方面存在着变化,...
30
3.2 无参考译文的质量估计
机器翻译评测中的参考译文一般都是语言专业人士给出的标准答案,这对每年进行的题材广泛的机器翻译评测任务而言,代价是昂贵的。在没有人工参考译文的情况下,为了有可以参...