过年第一天,继deepseek后,又一家量化投资搞起来的实验室:至知创新研究院发

蚁工厂 2026-01-02 01:31:35

过年第一天,继deepseek后,又一家量化投资搞起来的实验室:至知创新研究院发自己的大模型了!这次发布的是面向软件工程、竞赛编程的代码大模型IQuest-Coder系列最大参数40B,不算大,但有的跑分甚至能超过 claude Sonnet-4.5 详细介绍: iquestlab.github.io/IQuest-Coder-V1 采用了一种递进式的“代码流(Code-Flow)”三阶段训练范式:首先是预训练与退火阶段,利用通用数据混合代码数据建立基础,并通过高质量代码退火来巩固语言与生成能力 ;其次是关键的中间训练阶段(Mid-Training),通过引入 32k 至 128k 的长上下文,注入推理、智能体轨迹和仓库级代码数据,为模型搭建深层的逻辑脚手架 ;最后是分叉后训练阶段,将模型分为两条路径——通过强化学习优化推理能力的 Thinking 路径,以及针对通用任务优化的Instruct 路径,以适应不同的应用需求 。科技先锋官AI创造营

0 阅读:25
蚁工厂

蚁工厂

感谢大家的关注