4.2.5 结束语
本节提出的基于R-Gram的文本相似度计算方法,结合了短元素细粒度检测特性和长元素的高效检测特性,可以实现快速的文本相似度计算。另外本方法可以避免传统的文本相似度计算中不可避免的特征项提取这一繁杂过程,还可以避免很多计算方法中的分词环节。此外,本节所提出的方法还具备语言无关性,不仅适用于简体中文,也适用于繁体中文、英文等其他语言,只需要根据不同的语言特点设置适当的元素长度即可获得满意的效果。所提出的方法计算简单、快捷、准确,可以根据具体精度需要灵活设置参数,兼顾计算速度和计算精度,适合实时性要求较高的场合,在长文本相似度的计算中也具有良好的应用前景。