关于汽车中控大屏的 Computer-use Agent 这个事,实际打通的难度比想象得要更高。
汽车中控大屏比 PC 好做的地方很容易想到:场景高度垂直。
汽车中控大屏比 PC 难做的地方,其实有很多:行车场景要特别留意训练好这个场景里的因果推理、防呆、安全设计,不然容易搞出「晚上语音关大灯」的高风险 bug。
座舱和智驾跨部门合作的部门墙很高,不自上而下推动调整组织几乎没法搞。
要有一个很强的基础模型——这条可能打死了 95% 以上的车企,有些公司因为没有基础模型,是和外面的 AI 公司合作,那公司对公司的墙就更高了。
最终这个 Agent 才是你真正的私人司机,既有超人的驾驶技术,又会操作汽车上一切设置,也会陪你聊一切东西答疑解惑,这个 Agent 的重要性不比 AD Agent 低,绝不是模糊语义导航那么简单。
特斯拉虽然开了第一枪,但我猜测接下来特斯拉的节奏会慢下来。
原因是 xAI 后院起了大火,Starlink 高级副总裁 Michael Nicholls 最近已经兼任了 xAI 总裁,对 xAI 的进度非常不满。
恐怕 xAI 接下来得优先解决 AI 主航道明显落后的问题,来自特斯拉的需求应接不暇了。