的个人主页 http://faculty.nuaa.edu.cn/lizhang/zh_CN/index.htm
点击次数:
所属单位:航空学院
发表刊物:情报科学
关键字:文本复杂网络;特征降维;PCA;特征提取;
摘要:【目的/意义】本文构建一种“特征降维”文本复杂网络进行文本表示,解决传统词同现文本复杂网络处理海量数据时的维数灾难与语义不足问题,再结合机器学习方法提升文本特征提取效果。【方法/过程】依据共现关系抽取二级词条,再结合依存句法关系抽取三级词条,构建“特征降维”文本复杂网络,接着利用PCA算法和TOPSIS法评价网络节点重要性提取反映文本主题的关键词作为文本特征词,实现文本特征提取。【结果/结论】本文以网络新闻数据为实验对象。实验结果表明,特征降维文本复杂网络能较好地表示中文文本,并且在较好地保留了文本语义信息的同时有效减少网络节点冗余,结合PCA算法的特征提取方法可以使文本分类性能提高。
ISSN号:1007-7634
是否译文:否
发表时间:2019-10-01
合写作者:马静
通讯作者:张丽