1.3.3 时空区域、时间以及单词的主题分布
2025年09月21日
1.3.3 时空区域、时间以及单词的主题分布
在线社交网络时空主题模型(STTM)经过推理可以得到时空区域-主题分布θr、主题-时间分布ψ与主题-单词分布φW。通过以上三种分布将时空区域特征、时间特征与单词特征映射到主题语义空间中,得到不同特征的主题语义表示,可进一步推理得到每条在线社交网络消息中文本的主题语义表示。在线社交网络时空主题模型(STTM)包括三个隐变量:主题-时间分布ψ、时空区域-主题分布θr和主题-单词分布φ。通过对在线社交网络时空主题模型(STTM)进行多次迭代采样,实现隐变量的推理。对每个双词的主题进行采样,如式(1-1)所示:
在式(1-1)中,i表示排除该元素,Θ表示所有参数。为了计算式(1-1),需要计算联合概率分布,联合概率分布如式(1-2)所示:
通过联合式(1-1)和式(1-2),得到STTM的采样公式,如式(1-3)所示:
其中,n k表示每个主题出现的次数表示每个双词属于主题k的次数。通过重复迭代执行式(1-3),直到达到稳定状态,可得到隐变量的值。通过式(1-4)~式(1-7)估计参数θ、φ和ψ:
其中,参数ψ可以通过矩估计计算,和
分别表示主题k下的时间均值和方差。通过式(1-4)~式(1-7)可以得到在线社交网络时空信息流的时空区域、单词和时间进行表达。