中文

基于改进k-means算法的文本聚类

Hits:

  • Affiliation of Author(s):计算机科学与技术学院/人工智能学院/软件学院

  • Journal:计算机与现代化

  • Key Words:k-means算法;共现词;词向量;相似性;

  • Abstract:针对原始k-means算法对聚类数k很敏感这一问题,设计一种改进的k-means算法。该算法基于共现词的原理计算词向量之间的相似性,并根据相似性阈值将数据划分为k+x个簇,再将k-means算法用于k+x个簇中。将改进后的算法应用于文本聚类中,实验结果表明,改进后的算法比原算法聚类准确性更高。

  • Translation or Not:no

  • Date of Publication:2018-04-20

  • Co-author:蒋丽

  • Correspondence Author:xsl

  • Date of Publication:2018-04-20

Copyright©2018- Nanjing University of Aeronautics and Astronautics·Informationization Department(Informationization Technology Center) Click:
  MOBILE Version

The Last Update Time:..