华为刚刚扔出一张AI底牌:让大模型记忆力不再卡脖子 今天上午,华为发布了一套AI数据中心的完整方案。核心的突破就一个,解决大模型记不住的问题。 什么意思?你问AI一个复杂问题,它需要把前面的对话内容暂时记住,才能接着往下聊。这些记忆要存在显卡的超高速内存里,但显卡内存太贵也太小,聊深了就不够用了。 华为的解法很聪明:把记忆从显卡上搬下来,放到专门的高速存储设备上。用的时候瞬间调取,不用的时候不占显存。这一下,首句回复延迟直接降了90%。 这一手,和谷歌卷模型、英伟达卷芯片的路数都不太一样,华为是把大模型记忆力的墙,从根上凿穿了。 这套东西背后,是一整条产业链:帮华为做智能体平台的、供存储设备的、代工服务器的、配套液冷散热的,都会跟着受益。 但清醒的事也要说:方案刚发布,离客户真正大规模部署、变成实实在在的营收,还有相当长的路要走。相关公司股价已经涨了不少,预期打得越满,后面的波动就越大。 谷歌和英伟达卷芯片卷模型,华为却选择把大模型的记忆力做成独立系统,你觉得这条路能走通吗?评论区聊聊。 AI算力 大模型
