说个逻辑,结合腾讯元宝和自己的理解:理想的VLA,是从0开始训练了一个32b的V

星儿看汽车啊 2025-10-10 09:54:57

说个逻辑,结合腾讯元宝和自己的理解:

理想的VLA,是从0开始训练了一个32b的VL云端模型,再蒸馏得到的。车端VL的参量是3.2b,加上A的部分,整体参量4b。

至于VL云端模型和基座模型的关系,VL云端大模型的训练,基于理想自研的MindGPT基座模型的“语言能力”、“逻辑能力,基座模型是底层能力,VL云端模型是其中在智能驾驶的应用。

小鹏VLA,是通过“小鹏世界基座模型”的视觉理解能力,蒸馏了一个72b的VLA云端模型(来自元宝),再蒸馏到车端一个7.2B的VLA模型。

感觉两者差不多啊,在空间智能领域本质上都是VLA,而非世界模型[吃瓜]

0 阅读:0
星儿看汽车啊

星儿看汽车啊

感谢大家的关注