雷军果真挖到宝了?罗福莉AI最新突破曝光! 据智能纪元 AGI 报道,前 DeepSeek 研究员、小米 MiMo 大模型负责人罗福莉发表论文,与北京大学联合研发出统一的资源管理系统 ARL-Tangram。 ARL-Tangram 采用统一的动作级公式和弹性调度算法,不仅满足异构资源约束,而且最大限度地缩短动作完成时间(ACT),以及实现定制化异构资源管理器。 在真实世界的智能体强化学习任务上的评估表明,ARL-Tangram 可以将平均 ACT 提高高达 4.3 分。可将强化学习训练的步骤持续时间缩短至多 1.5 倍,并节省高达 71.2% 的外部资源。 能取得如此醒目的降本成效成果,估计罗福莉今年稳拿小米技术突破个人大奖了,天才AI少女的含金量,还在上涨!
