小模型逆袭:低成本技术碾压巨型AI!11月13日,发表在NatureNews上

棋羽笑谈世界 2025-11-15 13:48:49

小模型逆袭:低成本技术碾压巨型AI!11月13日,发表在Nature News上的一项突破性研究表明,一种仅从有限数据中学习的小型AI模型,在衡量通用人工智能的关键测试——抽象与推理语料库(ARC-AGI)中,击败了多个世界顶级大语言模型。这项技术有望为低成本提升AI推理能力开辟全新路径。这种名为“微型递归模型”(TRM)的AI系统,专门针对视觉逻辑谜题进行优化,在解决数独、迷宫等特定类型问题时表现卓越。尽管其规模仅为前沿大语言模型的万分之一,且不具备语言理解能力,但在ARC-AGI测试中的优异表现令研究人员振奋。该模型由加拿大蒙特利尔三星先进技术研究院的AI研究员亚历克西娅·朱利科厄-马蒂内奥开发,并于上月公开发布相关代码。她强调:“这项研究证明,只有耗费巨资训练庞大模型才能成功的观点是个陷阱。目前业界过于关注大型语言模型,而忽视了开拓新研究方向。”与传统大语言模型依赖海量参数和文档记忆不同,TRM采用创新学习方法。它仅使用700万个参数,针对每种谜题类型使用约1000个示例训练神经网络。模型通过反复比较猜测与正确答案,学习改进策略,并在解决新问题时进行多达16次的答案迭代优化。前机器学习研究员卢聪评价:“这项研究对其他形式推理的探索令人着迷,未来或可应用于大语言模型。”但他同时警告,该技术扩展到更大规模时可能失效。ARC-AGI测试创建者弗朗索瓦·乔莱特认为这些结果“意义重大”,尽管该模型需针对每个新问题从头训练而“相对不切实际”,但他预计将引发更多后续研究。这项突破表明,小而专的AI模型可能在特定推理任务上超越巨型模型,为资源受限环境下的AI发展提供了新思路。

0 阅读:7
棋羽笑谈世界

棋羽笑谈世界

感谢大家的关注