面向用户话题相似性特征的链路预测方法
【作者】
王菲菲
杨扬
蒋飞
许进
北京大学光华管理学院
北京100871
北京大学高可信软件教育部重点实验室
北京100871
【关键词】
链路预测
用户内容
主题模型
相似性特征
【摘要】针对线上用户间的链路预测对用户文本内容特征的挖掘不够充分的现象,提出了面向用户兴趣话题相似性的二次特征抽取方法。该方法应用主题模型得到任意用户的主题分布,利用用户在主题上相异的分布比例提取各自的兴趣话题集合,基于兴趣话题集合构造了一组话题相似性特征用于链路预测。不同于传统方法中对用户主题分布的直接利用,该方法对用户文本内容的相似性特征进行了再次挖掘,使得文本特征具有等同于结构特征的预测能力,并能够作为结构预测特征的有效补充。实验结果表明,内容特征的独立预测效果普遍优于结构特征,并且在联合预测中将结构特征的预测效果提高了3%。
上一篇:主动配电网多维度静态安全评估
下一篇:一种判别极端学习的相关反馈图像检索方法