酷,DeepSeek刚刚上新了最新模型:DeepSeek-Math-V2,达IMO金牌级水平基于DeepSeek-V3.2-Exp-Base,685B,专注于数学推理与定理证明Math-V2不仅是算答案,而是生成完整证明,能自己检查自己证明对不对的数学AI在IMO2025、CMO 2024上达到了金牌级成绩,在Putnam 2024上接近满分118/120具体是,先训练一个准确可信的验证器,来判断证明过程是否严谨再用该验证器作为奖励模型,训练一个证明生成器,鼓励其在提交前主动发现并修正证明中的问题随着生成器变强,持续扩大验证计算量,自动标注难以验证的证明,反哺验证器训练,形成“生成-验证”循环提升DeepSeekMath-V2等于让AI数学从出答案跃迁到了写证明,不光能写,还能自己检查哪里不对越写越严谨DeepSeekMathV2 姬永锋的微博直播
