5.2.3 动词形态错误

5.2.3 动词形态错误

动词形态错误包括主谓不一致、助动词错误、动词补足语错误,以及时态、语态、情态方面的错误等。动词形态错误检查常常基于语言规则进行(Omar et al.,2008)。规则由词汇表或词性序列触发,比如“情态动词+动词原形”这一规则,当出现情态动词时被触发。然后检查情态动词前后出现的1-2个单词,如果存在动词但没有使用“原形”就标记为动词形态错误,例如“could done”就会把“done”标记为动词形态错误。

语言学中严格符合规则的地方很少,简单规则往往适用面有限。上面的“情态动词+动词原形”规则允许在情态动词和动词原形之间出现副词,至于是否是一个副词,通过检查单词的词性就可以获得。如此这个规则就变得复杂了。

即使英语这种语法较为严格的语言,动词形态错误也是十分复杂的,存在很多规则不能处理的现象。Lee & Seneff(2008)发现动词形态错误会导致句法分析结果一致性的错误,因此就把动词形态错误引入正确的句子中,得到一组不正确的句法分析结果,然后和正确文本之间建立映射关系,构建了一个数据库。然后基于这个数据库发现动词形态错误,最后用Google的n-gram语料过滤掉不正确的判断结果。根据他们的研究数据,动词主谓一致错误的检测正确率高达98.9%。综合助动词一致性和动词补足语的错误检查率、整体动词形态错误检测的正确率达98.9%。这说明规则比较全面地覆盖了错误的类型。

微软的二语学习者(English as a Second Language,ESL)在线辅助学习工具ESL Assistant中也集成了基于机器学习的语法错误检查,包含了动词有关的错误检查功能。基于中国和日本学习者常犯的错误数据训练了一个最大熵分类器实现助动词、动名词和动词不定式等5种动词错误检查,具体包括:(Leacock et al.,2009):


动名词/不定式错误

He got me *roll/to roll up my sleeve and make a fist.

On Saturday, I with my classmate went *eating/to eat.

After *get/getting a visa, I want to study in New York.


助动词错误

To learn English we should *be speak/speak it as much as possible .

Hope you will *happy/be happy in China.

what *is/do you want to say?


动词形态错误

If yes, I will *attached/attach and resend to Geoff .

The time and setting are *display/displayed at the same time.

You had *order/ordered 3 items … this time.

I am really *hope/hoping to visit UCLA.


同根词与动词混淆错误

We cannot *image/imagine what the environment really

is at the site of end user .


不规则动词错误

I *teached/taught him all the things that I know …


但不足的是,文献中并未提及在最大熵分类器中使用了哪些特征。