我中心关于抗剪枝Mamba架构研究取得进展,相关研究成果发表在nips2025
NeurIPS全称为神经信息处理系统大会(Conference on Neural Information Processing Systems),与ICML、ICLR并称为人工智能领域三大顶级学术会议,以其严谨的评审流程和前瞻性的研究议题享誉全球。据NeurIPS 2025官方公布的论文收录结果所显示,本届NeurIPS会议共收到21575份有效投稿并进入评审流程,最终接收5290篇,整体录用率为24.52%。NeurIPS 是人工智能与机器学习领域具有重要影响力的国际顶级会议,在学术研究和产业应用中都占有重要地位,并被列为中国计算机学会 A 类推荐会议。会议将于 2025 年 12 月在美国加利福尼亚圣地亚哥和墨西哥举办,届时,论文作者将应邀在会议上展示其研究成果。
NeurIPS 2025选入的论文“Pruning-Robust Mamba with Asymmetric Multi-Scale Scanning Paths” 由四川大学作为成果第一单位。2023级博士生吕金地作为第一作者,导师吕建成教授,叶庆副研究员担任通讯作者,合作单位有新加坡国立大学。本研究提出了一种名为非对称多尺度视觉Mamba(AMVim)的创新架构,旨在提升模型剪枝鲁棒性。该架构采用双路径设计:一条路径整合窗口感知的扫描机制,另一条保持顺序扫描特性。这种非对称设计既促进token连接多样性,又实现多尺度信息流,从而增强空间感知能力。实验结果表明,AMVim在剪枝鲁棒性方面达到最好的性能水平。AMVim在保持相同模型规模和浮点运算量(FLOPs)的情况下,免训练精度提升达到34%。
背景介绍:
近年来,基于状态空间模型(SSMs)构建的Mamba架构,已成为视觉任务中高效建模长距离依赖关系的革命性范式。通过引入创新的链式扫描机制,Mamba成功将计算复杂度从Transformer的二次方需求降低到线性。然而,相较于Transformer,Mamba在进行剪枝时会表现出显著严重的性能崩塌。
创新点:
该研究AMVim以“非对称”与“多尺度”为突破口,体现了以下创新点:
1.我们证明了连接存活率是导致性能下降的关键因素,并提出采用非对称扫描路径来有效缓解该问题;
2.我们设计了一种多尺度的非对称扫描机制,在保持非对称路径的优势的同时,平衡了全局和局部空间信息;
3.我们的方法实现了最先进的抗枝弹性,在相同的参数和FLOPs下,提高34%的剪枝性能;

图 1:论文所提出的AMVim方法结构图

图 2: 不同剪枝率下的性能 vs. 吞吐实验结果
结论
AMVim通过“非对称结构设计”与“多尺度特征感知”的有机结合,构建了当前最为鲁棒的视觉Mamba网络架构。在图像分类、语义分割等多种视觉任务中,AMVim在不同剪枝强度下均展现出领先的性能表现,显著优于现有方法。该架构无需复杂调整即可实现高效的模型压缩,为面向边缘设备的轻量化部署提供了简单、高效且可落地的解决方案,具有重要的实际应用价值和推广前景。

吕金地,四川大学计算机科学与技术专业三年级博士生,研究方向为高效智能计算,聚焦神经架构搜索、多模态融合与视觉生成模型优化。在NeurIPS、CVPR等国际顶级会议及期刊发表多篇论文,研究成果涵盖轻量化模型设计、自动化网络结构搜索与高效微调方法。曾获四川大学优秀研究生、综合奖学金等多项荣誉。具备扎实的科研能力与工程实践能力,致力于推动智能模型在资源受限场景下的高效部署与应用。
