刚刚公布的WorldArena Track1评测中,智元获得WorldArena世界模型总分冠军。这个赛道聚焦世界模型在感知和动作响应上的表现,是衡量通用人形机器人智能化程度的关键标尺。智元的GE-Sim 2.0在评测中排名第一,而且团队特别强调,模型没有针对赛题做任何定向优化,只是用榜单数据做了微调就直接上场。GE-Sim 2.0相比上一代已实现全面升级,从单一的感知预测工具发展为完整的世界模拟器,具备长时序生成、多视角生成、本体状态生成、近实时推理和奖励判别等全部核心能力。在长时序生成任务里,连续推演四五十秒,画面质量仍明显优于基线前十秒。团队还用逐案rollout对比和混淆矩阵,严谨验证了仿真环境与真实世界的强相关性。借助奖励模型,闭环评测中的高质量数据可自动回流至策略模型,多项任务均取得显著性能进步。


