Affiliation of Author(s):航空学院
Journal:情报科学
Key Words:文本复杂网络;特征降维;PCA;特征提取;
Abstract:【目的/意义】本文构建一种“特征降维”文本复杂网络进行文本表示,解决传统词同现文本复杂网络处理海量数据时的维数灾难与语义不足问题,再结合机器学习方法提升文本特征提取效果。【方法/过程】依据共现关系抽取二级词条,再结合依存句法关系抽取三级词条,构建“特征降维”文本复杂网络,接着利用PCA算法和TOPSIS法评价网络节点重要性提取反映文本主题的关键词作为文本特征词,实现文本特征提取。【结果/结论】本文以网络新闻数据为实验对象。实验结果表明,特征降维文本复杂网络能较好地表示中文文本,并且在较好地保留了文本语义信息的同时有效减少网络节点冗余,结合PCA算法的特征提取方法可以使文本分类性能提高。
ISSN No.:1007-7634
Translation or Not:no
Date of Publication:2019-10-01
Co-author:Ma Jing
Correspondence Author:张丽