过年第一天，继deepseek后，又一家量化投资搞起来的实验室：至知创新研究院发

蚁工厂 2026-01-02 01:31:35

过年第一天，继deepseek后，又一家量化投资搞起来的实验室：至知创新研究院发自己的大模型了！这次发布的是面向软件工程、竞赛编程的代码大模型IQuest-Coder系列最大参数40B，不算大，但有的跑分甚至能超过 claude Sonnet-4.5 详细介绍： iquestlab.github.io/IQuest-Coder-V1 采用了一种递进式的“代码流（Code-Flow）”三阶段训练范式：首先是预训练与退火阶段，利用通用数据混合代码数据建立基础，并通过高质量代码退火来巩固语言与生成能力；其次是关键的中间训练阶段（Mid-Training），通过引入 32k 至 128k 的长上下文，注入推理、智能体轨迹和仓库级代码数据，为模型搭建深层的逻辑脚手架；最后是分叉后训练阶段，将模型分为两条路径——通过强化学习优化推理能力的 Thinking 路径，以及针对通用任务优化的Instruct 路径，以适应不同的应用需求。科技先锋官AI创造营

0 阅读：33

感谢大家的关注

作者最新文章

1

《The Hitchhikers Guide to LLM Agent》saur

2

《Advent of Claude: 31 Days of Claude Cod

3

可视化教程：Basic Statistics for Machine Learn

4

PyTorch 资源精选列表github.com/ritchieng/the-i

5

英伟达免费提供GLM 4.7和Minimax M2.1build.nvidia.

6

正在学Deepseek新论文“mHC: Manifold-Constrained

7

Claude Code的负责人Boris Cherny谈如何使用Claude C

8

知名技术人 Will Larson（现任 Imprint CTO，曾任 Stri

9

DeepSeek的新论文里有一句：“This conclusion is fur

10

主打一个不得罪人

热门分类

科技TOP

1

苹果公司近日为其员工送上了一份特殊的“生日礼物”，以此纪念品牌创立50周年。据悉

2

尚界Z7预售价22.98万起，Z7T预售价23.98万起，CLTC续航至高9

3

追觅手机研发首期投入100亿追觅手机开始计划投资100亿，目标到2027年手机团

4

成本压力下，各家都在温和调整3月16日0点，OPPO商城正式开启调价：•一加1

5

苹果变形脸表情火了这个表情看上去不太聪明啊有一股子不聪明又透露着好奇和天真无邪的

6

国家超算互联网免费支持OpenClaw国家超算互联网免费给OpenCla

7

给国内的ai排排座次，感觉有的高了，有的低了，有的太高了，有的太低了。

8

小米澎湃OS3“死亡笔记”更新了，小米官网产品安全中心更新部分终止维护（EOL

9

荣耀600Pro曝光：双2亿主摄+9000mAh电池，这配置绝了最近在网上看

10

【OpenAI完成其史上最大融资：OpenAI融资1220亿美元，估值达8520

科技最新文章

1

别再吹大屏，6.31英寸才是2026年真旗舰天花板朋友自从用上荣耀Magic

2

时间过得好快，感觉iPhone17才刚出，iPhone18就要来了。

3

小米18将首发高通2nm处理器。从骁龙855开始，小米和高通的"首发CP"已经跑

4

挺意外的😺华为Pura90系列基本确定了...好突然了，华为Pura90系

5

应该好多人现在依然在用iPhone16ProMax这台手机吧？[呲牙笑]202

6

今年三家影像超大杯电池容量：FindX9Ultra7050mAh小米17Ult

7

【REDMIK90Max配置揭晓】REDMIK90Max将在本月发布，这

8

红米K90Max外观公布，铝合金中框，圆形散热格栅，看着很有金属质感。天玑

9

疯传！华为宣布取消主动离职N+1？据互联网坊间八卦，除员工主动离职，严重违规违

10

天塌了😓刚刚我妈入了华为畅享90ProMax...买完了我才知道.