AI科研迎来基础设施革命!arXiv昨天(4月30日)同时发布三篇重磅论文,为自动化科学发现奠定新基石。 最引人注目的是Intern-Atlas项目,研究团队从103万篇AI论文中构建了940万条语义化边的方法论演化图。这个图谱能够自动识别方法实体、推断方法间的传承关系,并捕捉推动创新演化的瓶颈因素。研究者提出的时间树搜索算法可以追踪方法的时间演进,为AI驱动的科研agent提供了可查询的因果网络。这标志着研究基础设施从文档中心向方法论中心的范式转变。 在agent训练方面,微软亚洲研究院团队提出了Synthetic Computers at Scale方法论,创建了1000个合成计算机环境用于长期生产力模拟。每个模拟运行超过8小时、跨越2000多轮对话,生成丰富的经验学习信号。实验证明,这种大规模合成环境训练能显著提升agent在生产力任务上的表现,理论上可扩展至数十亿个合成用户世界。 然而,agent评测仍面临挑战。Claw-Eval-Live基准测试对13个前沿模型评估发现,工作流自动化远未解决:最高通过率仅66.7%,无模型达到70%。HR、管理和多系统业务工作流成为持续瓶颈。评测强调需要基于新鲜外部需求和可验证agent行动的双重基础。 此外,华尔街日报报道ChatGPT出现"地精迷恋"问题,OpenAI不得不紧急干预,反映出大模型行为对齐仍需持续关注。 这三篇论文共同指向一个趋势:2026年AI研究正在从单一模型能力转向系统化基础设施,为自动化科学发现和工作流革命铺平道路。Intern-Atlas、Synthetic Computers和Claw-Eval-Live分别从数据层、训练层和评测层构建了agent科研的完整技术栈。 AI资讯 人工智能
AI科研迎来基础设施革命!arXiv昨天(4月30日)同时发布三篇重磅论文,为自
移动信息杂谈簿
2026-05-03 08:12:39
0
阅读:0