Master's Degree in Engineering
With Certificate of Graduation for Study as Master's Candidates
Gender:Female
E-Mail:
Affiliation of Author(s):自动化学院
Journal:计算机工程
Key Words:Spark平台;频繁模式增长;并行化;负载均衡;链头表;计算量模型;
Abstract:在大数据时代,并行FP-Growth算法的研究成为重要热点之一。本文在PFP算法基础上,先针对FP-Growth算法存在查找操作时间复杂度较高的问题,在链头表中加入一张哈希表,实现项地址的快速访问,从而降低时间复杂度;然后针对负载均衡中由计算量模型产生的分组不均衡问题,提出基于前缀长度的计算量模型,同时优化并行流程,提升算法的执行效率。最后,通过对比实验说明本文提出的LBPFP算法具有更好的性能。
Translation or Not:no
Date of Publication:2018-01-26
Co-author:高权
Correspondence Author:wxd