3.3.6 标注维度

3.3.6 标注维度

将平行句对入库,首先建立英语和汉语两列,然后增加新列,记录录入顺序、翻译方向、录入类别等信息。其中翻译方向有两个值EC和CE,分别代表英译汉和汉译英。翻译方向这个信息,有助于我们检索语料时区分原创文本和翻译文本。把所有的语例采集入库后,我们以增加新列的方法来标注。所关注的标注维度有:语义类别、汉语析取关系标记、析取标记个数、析取支的语言单位、是否对话、析取支的相容性、析取支的穷尽性、汉语不确定性标记、否定标记共现情况、语气类型(陈述/疑问/祈使/感叹)、英语析取关系标记、对译后析取支的语序变化、英语不确定性标记、是否转换为合取、是否转换为蕴涵。