用户相似性分析技术详解

更新时间：2026-01-12 理论教育 版权反馈

【摘要】：相似性是指用户之间在共同社交行为方面的相似度。由表7-1能够看出，传统相似性算法认为用户1，2，3具有完全相同的兴趣；然而，实质上仅有80%的用户1与用户2完全相同，仅有60%的用户1与用户3完全相同，因此，用户1与用户2、用户3 的相似性相同是不合理的。表7-1用户参与项目集举例一般来说，如果用户之间共同参与的社交行为越多，那么其具有的相似倾向就越高，因此，根据传统算法，需引入系数α。

相似性是指用户之间在共同社交行为方面的相似度。它侧重体现用户彼此间的相似偏好，通常采取皮尔逊相关系数（Pearson Correlation）来计算。计算方法如公式（7-1）：

公式中，CRu，n为用户u与邻居n之间具有的共同社交项目的集合，ru，i为用户u对社交项目i的信任度，rn，i为用户n对社交项目i的信任度。

由表7-1能够看出，传统相似性算法认为用户1，2，3具有完全相同的兴趣；然而，实质上仅有80%的用户1与用户2完全相同，仅有60%的用户1与用户3完全相同，因此，用户1与用户2、用户3 的相似性相同是不合理的。

表7-1　用户参与项目集举例(https://www.daowen.com)

一般来说，如果用户之间共同参与的社交行为越多，那么其具有的相似倾向就越高，因此，根据传统算法，需引入系数α。然而，实际上用户之间在电子商务系统内一起参与的社交项目并不多，因此，共同参与的项目数可由共同参与的项目数占全部社交项目数的比例来替代。若比例越高，则用户兴趣的相似度就越高。在此基础上提出改进措施，即共同参与社交活动项目数α′的计算方法如公式（7-2）：

式中Ru是用户u的项目评价总数量，Rn是用户n的项目评价总数量。这个公式的算法不但可以以购买商品为媒介来反映消费者兴趣的相似性，还能够对消费者的购买行为予以体现。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

用户相似性分析技术详解

挖掘用户观点的情感分析技术

信号频域分析技术详解

房地产投资分析技术详解

用户宏程序应用实例详解

WindowsServer2008用户账户类

IMS域用户与业务标识详解

用户阅读时间分析介绍

主流技术详解：VRML技术、Flash技术

相关推荐