Gen-1:将具身基础模型scaling到精通水平 类比了GPT-3时刻,涌现表现在:1)能从多任务中获益;2)机器人领域的ScalingLaws 性能指标: 1)平均任务成功率99%(并非所有任务,此前Gen-0微调模型仅为64%;2)任务完成速度约为Gen-0最优方法的3倍;3)每项任务仅需约1小时机器人后训练数据(非常高的学习效率) 可靠性:GEN-1持续自主执行长时间操作,包括:连续一小时以上完成汽车零件套件组装、连续折叠86件T恤、对扫地机器人执行200余次维护、堆叠积木1800次、反复处理手机,全程无需人工干预 速度:折纸箱约需12秒,而此前需约34秒,提升约2.8倍;手机打包仅需15.5秒 即兴:在意外情况下展现创造性解决问题的能力,例如:对未对准的物体尝试多种重新抓取策略,或从异常摆放状态中恢复软性物体 数据侧:验证diverse海量非真机数据预训练,在后训练时使用少量真机即可适应机器人本体并完成任务。1)预训练数据来自UMI而非遥操数据,此前Gen-0有27万小时->这版50万小时物理世界交互数据,3个月23万,单月有效数据产能7万多小时 数据效率:GEN-1在使用10倍更少任务专项数据、更少微调步骤的情况下,达到了与GEN-0相当甚至更好的性能。 后续工作:1)继续提升更复杂任务成功率;2)降低数据量;3)与用户的alignment,保证涌现的是用户期待的行为
Gen-1:将具身基础模型scaling到精通水平 类比了GPT-3时刻,涌现
丹萱谈生活文化
2026-04-03 17:08:16
0
阅读:4