李文通

个人信息Personal Information

副研究员 硕士生导师

性别:男

毕业院校:浙江大学

学历:博士研究生毕业

学位:工学博士学位

所在单位:人工智能学院

办公地点:将军路校区-西区1号楼-12层1205室

电子邮箱:

扫描关注

个人简介Personal Profile

李文通,南京航空航天大学人工智能学院,副研究员,多媒体与视觉感知课题组(MVP Lab)成员,依托于脑机智能技术教育部重点实验室


2024年6月博士毕业于浙江大学,主要从事计算机视觉、多模态理解与感知、具身理解与交互、多模态大模型等方向的相关研究。目前已在国际权威期刊和会议上发表论文二十余篇,包括T-PAMI、IJCV、CVPR、 ICCV、ECCV、NeurIPS、ICLR、AAAI等, Google Scholar引用1000余次, 受邀担任T-PAMI/IJCV/CVPR/ICCV/ECCV/NeurIPS/ICLR/ICML/AAAI等相关会议或期刊的程序委员会委员和审稿人,曾获浙江大学优秀博士论文,浙江省优秀毕业生,浙江大学优秀毕业生,腾讯奖学金。 欢迎访问个人主页了解更多信息:https://cslwt.github.io/ 。


Updates:

  • [2025.05.23] 一篇工作被IJCV接收 (IF:11.6);

  • [2025.02.27] 五篇工作被CVPR2025接收,其中一篇为Highlight (2.9%)

  • [2024.12.30]  我的博士毕业论文被评为浙江大学优秀博士学位论文


团队长期招收博士生、硕士生、本科生科研助理,与秦杰教授共同指导。

希望你:

1)上进、有正能量、有责任心;

2)有强烈的自驱力(Self-Motivation),真正喜欢AI相关科研;

3)具有较强的自学能力、编程能力和英语水平。


欢迎感兴趣、有志科研的同学,邮件联系我并附上个人简历。


  • ● 个人聚焦前沿科技,希望做solid工作和学生平等相处,互相帮助,希望营造自由轻松的环境下做有意义的创新研究工作。

  • ● 浙江大学香港理工大学蚂蚁集团密切合作,可推荐优异的同学去以上单位交流、深造、(研究型)实习。此外,还与吉利研究院、华为云展开相关研究合作。


部分代表性论文: 

  • ●  Wentong Li*, Yuqian Yuan*, Jian Liu, Dongqi Tang, Song Wang, Jie Qin, Jianke Zhu, Lei Zhang. "TokenPacker: Efficient Visual Projector for Multimodal LLM",  IJCV2025, CCF-A.

  • ●  Hanxun Yu*, Wentong Li*, Song Wang, Junbo Chen, Jianke Zhu. "Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning", CVPR2025, CCF-A. (Hihglight,2.9%) 

  • ● Wentong Li, Wenyu Liu, Jianke Zhu, Miaomiao Cui, Risheng Yu, Xiansheng Hua, Lei Zhang. "Box2Mask: Box-supervised Instance Segmentation via Level-set Evolution", T-PAMI2024, CCF-A.

  • ● Yuqian Yuan*, Wentong Li*, Jian Liu, Dongqi Tang, Xinjie Luo, Chi Qin, Lei Zhang, Jianke Zhu. "Osprey: Pixel Understanding with Visual Instruction Tuning", CVPR2024, CCF-A.  (Project Leader) 

  • ● Wentong Li*, Yuqian Yuan*, Song Wang, Wenyu Liu, Dongqi Tang, Jian Liu, Jianke Zhu, Lei Zhang."Label-efficient Segmentation via Affinity Propagation", NeurIPS2023, CCF-A.

  • ● Wentong Li, Yuqian Yuan, Song Wang, Jianke Zhu, Jianshu Li, Jian Liu, Lei Zhang. "Point2Mask: Point-supervised Panoptic Segmentation via Optimal Transport", ICCV2023, CCF-A.

  • ● Wentong Li, Wenyu Liu, Jianke Zhu, Miaomiao Cui, Xiansheng Hua, Lei Zhang. "Box-supervised Instance Segmentation with Level Set Evolution", ECCV2022, CCF-B.

  • ● Wentong Li, Yijie Chen, Kaixuan Hu, Jianke Zhu. "Oriented RepPoints for Aerial Object Detection", CVPR2022, CCF-A. 



  • 教育经历Education Background
  • 工作经历Work Experience
    2020.9 2024.6
    • 浙江大学
    • 计算机技术
    • 工学博士学位
  • 研究方向Research Focus
  • 社会兼职Social Affiliations
  • 多模态场景理解:细粒度图像/视频理解与分析

  • 具身智能:具身场景下的感知、推理、导航与交互

  • 多模态大模型:多模态大模型及其轻量化+下游基础视觉任务