[CL]《EmbarrassinglySimpleSelf-Distilla

爱生活爱珂珂 2026-04-05 06:53:45

[CL]《Embarrassingly Simple Self-Distillation Improves Code Generation》R Zhang, R H Bai, H Zheng, N Jaitly… [Apple] (2026)

代码生成中，LLM 面临一个隐秘的结构性矛盾：序列中某些位置需要精确锁定唯一正确词元（"锁"），另一些位置则需要在多条可行路径间自由探索（"叉"）。全局解码温度无法同时满足两者——降温保住了锁，却扼杀了叉的多样性；升温放开了叉，却让锁的干扰尾巴死灰复燃。现有方法或依赖更强的教师模型，或需要执行反馈验证，均绕开而非解决这一矛盾。

本文的核心洞见是：把"用什么数据训练"重新看作"用什么温度和截断配置采样自身输出"的问题。以高于默认温度采样、截断低概率尾部，再用标准监督微调训练回模型自身。这一操作迫使模型在"锁"位置聚拢概率质量、压制干扰尾，在"叉"位置则因保留多个可行词元而维持探索空间——两种效果由同一训练目标在不同支撑集几何上自适应产生，无需任何正确性标签。

这项工作真正留下的遗产是：强模型内部存在被固定解码策略压抑的潜在能力，而分布重塑本身就是一种可提取的学习信号——即便训练数据 62% 是乱码，模型仍能提升。它为后来者打开的新门是：无需验证器、教师或强化学习的自我进化路径，以及将解码配置设计纳入训练信号设计的新视角。但尚未跨过的门槛是：方法目前仅在代码生成领域得到深入验证，训练数据域外的能力权衡在小模型上尚不稳定，且理论分析依赖局部理想拟合近似，与实际训练动态的差距仍待填补。

arxiv.org/abs/2604.01193

机器学习人工智能论文 AI创造营

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【Gemma 4虽亮眼 Qwen 3.5效率仍占优】快速阅读：Gemma 4发布

2

[人人能懂AI前沿] AI进化三部曲：从内存压缩、自我蒸馏到记忆涌现今天，我们将

3

[人人能懂AI前沿] AI进化三部曲：从内存压缩、自我蒸馏到记忆涌现网页链接

4

今日推介(第2096期)：基于均匀角度量化实现近乎无损的KV缓存压缩、针对You

5

[AI]《Quantifying Self-Preservation Bias

6

[AI]《ByteRover: Agent-Native Memory Thro

7

[CL]《Embarrassingly Simple Self-Distilla

8

[CL]《Multimodal Analysis of State-Funded

9

[LG]《TurboAngle: Near-Lossless KV Cache

10

早！早安

热门分类

科技TOP

1

vivoX300s的爆料也来了，外围规格全部拉满了。6.78英寸144Hz蔡

2

苹果公司近日为其员工送上了一份特殊的“生日礼物”，以此纪念品牌创立50周年。据悉

3

尚界Z7预售价22.98万起，Z7T预售价23.98万起，CLTC续航至高9

4

追觅手机研发首期投入100亿追觅手机开始计划投资100亿，目标到2027年手机团

5

成本压力下，各家都在温和调整3月16日0点，OPPO商城正式开启调价：•一加1

6

苹果变形脸表情火了这个表情看上去不太聪明啊有一股子不聪明又透露着好奇和天真无邪的

7

国家超算互联网免费支持OpenClaw国家超算互联网免费给OpenCla

8

给国内的ai排排座次，感觉有的高了，有的低了，有的太高了，有的太低了。

9

小米澎湃OS3“死亡笔记”更新了，小米官网产品安全中心更新部分终止维护（EOL

10

当下高端手机市场同质化严重，各大品牌陷入参数堆砌的内卷怪圈，追觅AURORA手机

科技最新文章

1

左边是1699元的华为畅享90ProMax，右边是1699元的荣耀X70，同

2

【消息称某厂子系LCD性能小平板、笔记本暂定同期登场，预计为小米REDMI

3

这一代超大杯旗舰的电池和影像方案：

4

荣耀平板最近杀疯了！PC应用适配越来越多，平板真能当电脑用了？我的Magic

5

真的离谱[捂脸哭]荣耀Magic8竟然和荣耀WIN“打起来”了，本是同根生，相煎何

6

荣耀新一轮系统更新来了，适配的手机名单，快来看看有你的机型没有现在的荣耀主打

7

为什么小米涨价不会被骂？其他几家却被说成吃相难看。小米中国区市场部经理魏思琪

8

网传索尼新机外观，你们给打几分？

9

没救了，华为畅享90系列算是被黑惨了！有些人真的是让人无语，居然拿畅享90

10

OPPO官宣了！4月21日19点在成都开「OPPOX哈苏影像新品