[LG]《TurboAngle:Near-LosslessKVCache

爱生活爱珂珂 2026-04-05 05:54:46

[LG]《TurboAngle: Near-Lossless KV Cache Compression via Uniform Angle Quantization》D Patel [LLMs Research Inc.] (2026)

大语言模型推理时，KV缓存随序列长度线性膨胀，已成为长上下文场景的内存瓶颈。现有量化方法直接压缩原始激活值，却面临离群值、通道分布差异和非高斯分布三重困境，不得不依赖逐通道校准数据来补偿——这在频繁更新模型或边缘部署场景中代价高昂。

本文的核心洞见是：把"如何均匀量化分布不规则的数值"重新看作"先找到一个分布天然均匀的坐标系，再用最优量化器"。具体操作是在随机符号旋转后施加快速Walsh-Hadamard变换，使相邻元素对的角度在单位圆上趋近均匀分布——均匀分布对应的最优量化器恰好就是等间隔划分，无需任何校准。进一步地，对各层独立配置K/V码本大小，并对K范数用8位线性量化、对V范数用4位对数空间量化，形成零校准的端到端压缩方案。

这项工作真正留下的遗产是：证明了"构造分布已知的变换域"可以将校准需求彻底清零，同时揭示了K缓存范数比V缓存范数敏感10—20倍这一此前未被报告的不对称性。它为后来者打开的新门是：基于理论分布而非经验统计来设计量化器的方法论路径。但尚未跨过的门槛是：仅用困惑度在单一数据集上评估，下游任务表现与长上下文基准仍是未解之题。

arxiv.org/abs/2603.27467

机器学习人工智能论文 AI创造营

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【Gemma 4虽亮眼 Qwen 3.5效率仍占优】快速阅读：Gemma 4发布

2

[人人能懂AI前沿] AI进化三部曲：从内存压缩、自我蒸馏到记忆涌现今天，我们将

3

[人人能懂AI前沿] AI进化三部曲：从内存压缩、自我蒸馏到记忆涌现网页链接

4

今日推介(第2096期)：基于均匀角度量化实现近乎无损的KV缓存压缩、针对You

5

[AI]《Quantifying Self-Preservation Bias

6

[AI]《ByteRover: Agent-Native Memory Thro

7

[CL]《Embarrassingly Simple Self-Distilla

8

[CL]《Multimodal Analysis of State-Funded

9

[LG]《TurboAngle: Near-Lossless KV Cache

10

早！早安

热门分类

科技TOP

1

vivoX300s的爆料也来了，外围规格全部拉满了。6.78英寸144Hz蔡

2

苹果公司近日为其员工送上了一份特殊的“生日礼物”，以此纪念品牌创立50周年。据悉

3

尚界Z7预售价22.98万起，Z7T预售价23.98万起，CLTC续航至高9

4

追觅手机研发首期投入100亿追觅手机开始计划投资100亿，目标到2027年手机团

5

成本压力下，各家都在温和调整3月16日0点，OPPO商城正式开启调价：•一加1

6

苹果变形脸表情火了这个表情看上去不太聪明啊有一股子不聪明又透露着好奇和天真无邪的

7

国家超算互联网免费支持OpenClaw国家超算互联网免费给OpenCla

8

给国内的ai排排座次，感觉有的高了，有的低了，有的太高了，有的太低了。

9

小米澎湃OS3“死亡笔记”更新了，小米官网产品安全中心更新部分终止维护（EOL

10

当下高端手机市场同质化严重，各大品牌陷入参数堆砌的内卷怪圈，追觅AURORA手机

科技最新文章

1

左边是1699元的华为畅享90ProMax，右边是1699元的荣耀X70，同

2

【消息称某厂子系LCD性能小平板、笔记本暂定同期登场，预计为小米REDMI

3

这一代超大杯旗舰的电池和影像方案：

4

荣耀平板最近杀疯了！PC应用适配越来越多，平板真能当电脑用了？我的Magic

5

真的离谱[捂脸哭]荣耀Magic8竟然和荣耀WIN“打起来”了，本是同根生，相煎何

6

荣耀新一轮系统更新来了，适配的手机名单，快来看看有你的机型没有现在的荣耀主打

7

为什么小米涨价不会被骂？其他几家却被说成吃相难看。小米中国区市场部经理魏思琪

8

网传索尼新机外观，你们给打几分？

9

没救了，华为畅享90系列算是被黑惨了！有些人真的是让人无语，居然拿畅享90

10

OPPO官宣了！4月21日19点在成都开「OPPOX哈苏影像新品