4.6.2 智能推荐技术
1.基于规则的推荐算法
基于规则的推荐算法中的规则,既可以是用户定义的规则,也可以是数据挖掘中的关联规则。目前的应用大多以关联规则为主,现代电子政务的推荐系统中广泛地应用了在数据挖掘领域中十分重要的关联规则技术。
基于规则的推荐算法由已有规则查找用户可能感兴趣的项目,并按照一定方式对这些项目进行排序,根据排序完成最终的推荐[150]。其大体的流程如下:首先由已经被用户标注过的偏好项目,按照特定的规则推测出当前用户可能的还未被标注的偏好项目,然后根据不同的偏好重要性进行排序,最后生成推荐列表给用户。在整个算法中,最为重要的部分,就是关联规则的确定。基于规则的推荐技术的优点是:可以应用在所有领域,具有通用性;而且可以推荐出新的用户感兴趣的资源。利用规则来推荐信息依赖规则的质量和数量。
2.基于内容的推荐算法
基于内容的推荐算法即是依据用户已经选择过的项目的特征来推测判断出用户的偏好,从而为用户更好地推荐其他项目。基于内容的推荐算法是随着机器学习、概率统计、自然语言处理等方向的技术越来越成熟由协同过滤算法发展而来,亦是对协同过滤算法的一种延续。基于内容的推荐算法能够较好地规避协同过滤算法中的冷启动等问题,但其建模、分析、实现等都更为复杂。
基于内容的推荐算法的大致流程为首先采集用户的偏好信息,提取出项目的特征,然后依据特征建立用户模板,生成待推荐项目的文本向量,通过余弦相似度等常用方法计算待推荐项目与用户偏好项目模板的相似度,按照相似度由高到低的次序生成列表推荐给用户。计算相关度与更新用户模板是基于内容的推荐算法中的关键所在。在计算相关度时,研究人员可以引入包括人工神经网络、支持向量机等在内的技术,并且已经取得了很好的效果。一般的基于内容的推荐算法主要分为两大部分,一是如何计算出待推荐项目与用户偏好项目模板的相似度;二是利用求得的相似度来预测待选项目的评分。用户的偏好信息,既可以由上文提到的方式提取特征获取,也可以通过注册时用户填写或发邮件等调查方式显示的获取。
基于内容推荐的方法有很多优点:它不需要其他用户的数据,没有冷启动问题和稀疏问题;能为具有特殊兴趣爱好的用户进行推荐;能推荐新的或不是很流行的项目,没有新项目问题;通过列出推荐项目的内容特征,可以解释为什么推荐那些项目。