陈松灿
Professor
Alma Mater:杭州大学/上海交通大学/南京航空航天大学
Education Level:南京航空航天大学
Degree:Doctoral Degree in Engineering
School/Department:College of Computer Science and Technology
E-Mail:
Hits:
Affiliation of Author(s):计算机科学与技术学院/人工智能学院/软件学院
Journal:中国科学:信息科学
Key Words:垃圾邮件过滤;个性化邮件再过滤;自动修正;重要性加权;多任务学习;多窗口学习框架;
Abstract:电子邮件是一种必不可少的通讯工具,但是众多的垃圾邮件会严重影响用户的工作和生活,甚至还会造成财产损失.由于兴趣、爱好的不同,用户对垃圾邮件的定义可能存在巨大差异,因此实现个性化垃圾邮件过滤成为目前邮件过滤领域研究的重要课题.当出现邮件错滤情况,用户不得不手动修改,这给用户体验带来了极大不便.为了有效解决上述问题,并实现个性化邮件过滤及错滤邮件自动修改等功能,本文结合规则和统计方法提出了一种基于客户端的个性化邮件再过滤系统.大部分现有的垃圾邮件过滤器仅对邮件数据流进行在线过滤,而未考虑不同邮箱的邮件类先验存在差异和类不平衡问题,本过滤系统首先对进入收件箱和垃圾箱的邮件进行分别处理,然后基于多任务学习原理设计了两个互学习的过滤器分别用于收件箱和垃圾箱的邮件再过滤,并对错滤邮件进行自动修改.同时,为保证在随时间变化的用户兴趣点和邮件数据分布情况下过滤器的性能,设计了结合重要性加权的多窗口学习框架,从而有效实现了过滤器的动态自适应.最后,在TREC 2006c和2007p数据集上验证了我们所提出的过滤器拥有显著的过滤效果.
Translation or Not:no
Date of Publication:2018-12-12
Co-author:徐丹丹
Correspondence Author:csc