牛津/NVIDIA重磅：突破KVCache压缩瓶颈

智能机器之心 2026-05-27 15:46:11

在处理超长上下文时，Transformer 的 KV Cache 显存暴涨、推理变慢一直是业界的切肤之痛。来自牛津大学 OATML 实验室、NVIDIA以及 Technion 的联合研究团队发表了突破性论文《Training Transformers for KV Cache Compressibility》，从训练源头为大模型「瘦身」开辟了新路径！当前长文本需求井喷，但 KV Cache 随文本长度线性暴增（$$\mathcal{O}(N$$），极易导致显存溢出。现有的「事后压缩」（如 Post-hoc 量化或剪枝）属于「硬着陆」，如果模型原生表征不友好，强行压缩会导致性能急剧崩塌。团队首次从数学上形式化了「KV 可压缩性」。他们惊人地证明了：KV Cache 是否好压缩，完全取决于模型在训练中习得的「内部表征」！即使实现完全相同的功能，模型也可能走向「本质不可压缩」的死胡同。因此，必须在训练阶段进行干预。团队提出 KV-CAT（KV Compression Aware Training）持续预训练方法： 🔸核心机制在训练时引入轻量 router，对部分 forward pass 主动掩蔽（mask）一定比例的 KV slots，制造信息瓶颈；同时通过 masked forward 与 dense forward 的自蒸馏，迫使模型学习对压缩高度鲁棒的内部表示。 🔸关键优势推理时无需改动模型架构，即可显著提升各类现有 post-hoc 压缩方法的效果。实验显示（基于 Qwen2.5 系列）： 1.未压缩性能基本持平或略有提升 2.压缩后 Needle-in-Haystack 检索准确率最高提升 +68% 3.LongBench 长上下文任务最高提升 +39% 4.优化-based 压缩方法的收敛速度最高快 5 倍这项研究彻底改变了「先训练、后压缩」的传统被动思路，通过在训练期注入压缩感知，让大模型「天生」自带高效压缩体质，为长上下文大模型在有限硬件资源下的平民化落地提供了坚实的理论与工程支撑！对追求极致长上下文效率的团队（如 RAG、agent、长文档建模）非常有参考价值。如果你觉得对你有用的话～欢迎点赞收藏并分享给你的盆友们～非常感谢！

0 阅读：2

智能机器之心

感谢大家的关注

作者最新文章

1

阶跃发布Step 3.7 Flash，多！快！好！省！

2

Sakana AI 新作：像拼积木一样训练大模型！

3

史上最强手写博士论文，没有之一！

4

逆天！彭博社曝光iOS 27 新 Siri，长这样…

5

李飞飞获布朗大学荣誉博士，同台皆是大佬！

6

英伟达老板黄仁勋，去清华当顾问了！

7

罗福莉谈MiMo降价背后，仍有2-3倍利润空间

8

数学大战，Mythos也攻克Erdős单位距离问题

9

《柳叶刀》警告：AI正在污染医学指南

10

CMU与UMD最新研究：大模型也需要“睡觉”!

科技TOP

1

库克也找马斯克合影，马斯克是不是白的喝多了有人说这俩都从美国来的，在中国合影干啥

2

成功了，俄罗斯光刻机终于研发出来了！俄罗斯ProgressSTP-350光刻机

3

大厂疯狂开源，不怕抄袭了？格局变大了？还是别天真了，商场没雷锋，全是阳谋……

4

魅族懵了！小米也懵了，第一个把副屏干成"奢侈品"的，居然是荣耀！磁吸副屏终于来

5

华为放大招！麒麟2026+韬定律，彻底跳出芯片卡脖子！刚从ISCAS2026现

6

为什么中文正在被AI“偷偷加价”？同样一句话，中文消耗的Token比英文更多

7

贾跃亭又拿到7000万美元投资贾跃亭又拿到了7000万美元的融资，目标是五年内在

8

80后真的见证了时代巨变用过算盘、计算器、DOS、win95、98、2000、X

9

兄弟们，摩托罗拉motorazr70Ultra正式发布，直接7499起

10

这个数据让人震惊，2025年Q4，在外卖领域，美团占了45%，淘宝居然占了45.

科技最新文章

1

天气越热，手机越烫手😭最近也太热了，体感直接上39度......整的iP

2

小米最可怕的，可能已经不是汽车了。很多人还在盯着SU7、YU7销量，结果这次财报

3

黄仁勋加入清华大学顾问委员会搜了下，这个委员会的现任主席是苹果CEO库克，其

4

vivo首款头戴降噪耳机配置还行，看怎么定价了，降噪最大深度58dB，重量

5

听我一句劝！现在就是荣耀500Pro的天下，性价比看它就行了荣耀

6

老黄加入了清华大学经济管理顾问委员会，该委员会的使命是加强学院与外部各界的联系，

7

DeepSeek崩了现在已经修复了，但崩的次数有点太频繁了，每个月都要来上这么一

8

折叠iPhone首批保护壳亮相了，看完图其实心里只有一个想法：既然这么复杂，还是

9

荣耀OS这波更新！锁屏直接封神了家人们。首款3D动态景深锁屏+通透到发光～

10

雷鸟GTMax售价2599元、雷鸟GT售价1899元。雷鸟GT