2.2.1 机器词典的语言学基础
2025年09月26日
2.2.1 机器词典的语言学基础
Halliday从语言学的角度对机器词典进行了研究,所采用的理论框架为阶与范畴语法。该语法的基本观点如下(参见胡壮麟、朱永生、张德禄等,2005:30-36;Halliday和Webster,2007:24):
(1)层次。语言描写有三个基本层次:实体、形式和语境。实体指声音的和书面的语言原材料。形式是语言的有意义的组合,包括语法和词汇两个子层次。它们通过音系学和字音学来反映不同的实体。第三个层次为语境,通过语言形式来反映非语言内容的模式。各层次之间的关系如图2.1所示[1]:
图2.1 语言的层次观
(2)范畴。Halliday提出了四个主要的范畴——单位、结构、类和系统。其中,类、结构和单位之间具有紧密的关系:类总是参照上一级单位的结构而进行定义;而结构总是参照下一级单位的类而定义。
系统是一系列类似项目的组织。在一个系统中,一般包括多个项目。这些项目可以是语法范畴,也可以是具体的词汇。例如,英语中的体(aspect)系统包括了进行体、完成体等多个项目。
(3)阶。为了说明上述四个范畴之间的关系,Halliday区分了三个阶(scale)——级(rank)、说明(exponence)和精密度(delicacy)。
级阶主要说明语言单位之间的联系。在英语中,一般区分了五个基本的单位:句、小句、词组/短语、词和词素。说明阶将范畴与语言材料联系起来。例如,“the old man”的单位是词组;结构是冠词+形容词+名词;类是名词词组。精密度用于表示范畴之间的区别或详细程度。此外,它也用来揭示词汇和语法之间的关系,即词汇被认为是最精密的语法。两者之间的关系是一种连续统,共同构成了一种语言的词汇-语法系统。