发表时间:2018-11-12 点击次数:
所属单位:经济与管理学院
发表刊物:情报科学
关键字:LDA模型;微博话题;话题特征;特征抽取;
摘要:【目的/意义】提出一种基于可扩展LDA模型的微博话题特征抽取方法。【方法/过程】利用词语权重调整方法筛选高贡献度高频词语;基于bootstrap思想,迭代产生特征词条候选集;引入信息熵值理论筛选话题词条;并利用四维泛化分类实现对特征词条的泛化和归类。【结果/结论】本文以真实新浪微博数据为实验对象,实验结果表明基于扩展LDA模型的特征词提取方法可弥补传统LDA模型在话题可解释性上的不足,有效地对微博文本进行话题特征抽取。
是否译文:否
发表时间:2017-04-05
合写作者:邱明涛,张磊,姚兆旭
通讯作者:马静
发表时间:2017-04-05