米传民
开通时间:..
最后更新时间:..
点击次数:
所属单位:南京航空航天大学经济与管理学院
发表刊物:数据分析与知识发现
关键字:社区问答;专家推荐;BERT; Labeled-LDA; PageRank
摘要:【目的】 对用户历史问答文本实现考虑上下文语义信息的主题识别,进而提升问答社区专家推荐的准确度。【方法】 通过构建BERT-LLDA模型,将BERT模型与Labeled-LDA主题模型相结合,充分利用标签信息对用户历史问答文本进行向量化,通过降维和主题聚类实现考虑上下文语义信息的主题识别,获得用户的主题兴趣概率分布;根据主题兴趣挖掘结果构建主题敏感PageRank 算法(TSPR),并加入用户质量权重迭代计算用户的领域权威;基于此得到考虑主题兴趣和领域权威的问答社区专家推荐算法TIDARank,为新问题推荐潜在回答专家。【结果】 基于Stack Exchange 公开数据集,BERT-LLDA模型经过主题聚类后相比TF-IDF、BERT、BERT-LDA等对比模型具有更高的轮廓系数(0.575 6)和主题连贯性(0.476 6);TIDARank 算法的最佳回答者命中率ACC@20 和平均倒数排名MRR@20 分别为0.580 7 和 0.243 0,相比于表现最优的对比模型Bi-LSTM+TSPR分别提升0.145 和0.081。【局限】 在链接分析中未考虑用户的活跃情况。【结论】 BERT-LLDA模型不仅可以优化主题聚类的效果,且有助于提升问答社区专家推荐的性能。
论文类型:期刊论文
卷号:8
期号:5
页面范围:68-79
是否译文:否
发表时间:2024-05-15
合写作者:肖琳,苟小义
通讯作者:米传民