3.2.4 SCTE算法的实现步骤

3.2.4 SCTE算法的实现步骤

基于动态自聚合主题模型的在线社交网络文本主题表达算法(SCTE)的实现步骤如下所示。利用在线社交网络短文本信息作为输入,采用动态自聚合主题模型(SADTM)建模短文本语义,聚合短文本为长文本来解决社交网络上下文稀疏性问题,并通过先前推测的主题分布和词分布来计算当前的主题分布和词分布。

算法3-1 基于动态自聚合主题模型的在线社交网络文本主题表达算法

输入:主题数K、模型超参数αt-1、βt-1、短文本R、ϕt-1和θt-1、迭代次数N iter

输出:微博话题分布θ和词分布ϕ

(1)更新分配给短文本中词对的总数N R

(2)更新分配给主题z的词对数量N R,k

(3)更新在聚合文档中词对分配给主题z的次数N t,d,k

(4)重复执行式(3-4)的条件分布公式,直到趋于稳定

(5)根据式(3-5)计算微博中主题的持续性衡量α

(6)根据式(3-6)计算微博中词的持续性衡量β

(7)根据式(3-1)和式(3-7)计算微博话题分布θ

(8)利用式(3-2)和式(3-8)计算主题的词分布ϕ

(9)利用式(3-9)计算在聚合文档d与主题K在时间t的相关概率

(10)根据得到的话题分布和词分布实现在线社交网络文本主题表达