1.3.1 OSNTR算法的研究动机
在线社交网络消息在不同时空情境下的含义不同,为了对在线社交网络信息进行准确的语义表达,需要同时考虑文本信息、时间信息和空间位置信息。在线社交网络中的文本消息较短,在将传统的语义表达方法应用到在线社交网络短文本数据时会面临语义稀疏性的问题。因此,为了对在线社交网络文本信息进行高质量地表达,需要解决短文本的语义稀疏性问题。
本章提出的基于时空主题模型的在线社交网络文本信息表达算法(OSNTR),通过构建时空主题模型(STTM),同时融合了在线社交网络中的文本、时间和位置信息,克服了短文本的语义稀疏性,实现了在线社交网络时空信息的表达。基于时空主题模型的在线社交网络文本信息表达算法(OSNTR)包括两部分:在线社交网络时空主题模型的建立、基于STTM的在线社交网络时空信息表达。引入双词特征、时间特征和位置特征,并设定同一时空区域下的在线社交网络消息共享同一主题分布,建立在线社交网络主题模型,对该模型进行推理获取时空信息的主题分布,实现对在线社交网络时空信息的表达。