谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了。 他带人干了件最狂的事,花五个月把底层代码全迁到了华为昇腾上,彻底不要英伟达的CUDA了。 消息一出,英伟达 CEO 黄仁勋在采访里急得直跳脚,甚至说出 “芯片又不是浓缩铀” 这种话。这哪里是卖不卖芯片的问题,这是中国 AI 自己把路铺好了,以后不再看别人脸色。 过去这些年,全球 AI 大模型几乎都绑在英伟达的 CUDA 生态上。CUDA 不是简单的软件,它是英伟达用十几年时间建起来的 “AI 基础设施”,里面有成熟的工具、海量的代码库、无数开发者的经验积累。 对中国企业来说,这就像吃饭必须用别人的碗筷,人家不给,你就没法吃饭。高端英伟达芯片被禁后,国产 AI 芯片虽然不差,但生态跟不上,很多模型跑不起来,或者效率极低。 DeepSeek 之前也一样,和所有同行一样依赖 CUDA。直到梁文锋做出一个几乎没人敢做的决定:全栈迁移,彻底脱离 CUDA,转向华为昇腾。 很多人以为 “换芯片” 就是换个硬件,其实完全不是。这相当于把一栋用了十几年的房子,从地基到钢筋全部拆掉,在新的土地上重建,而且要保证房子比以前更结实、更好用。 五个月时间,团队要重写底层代码、重构算子库、调整调度逻辑,每一步都是从零开始。工程量大到业内人形容为 “爬雪山、过草地”。中途甚至因为难度太大,内部出现过意见分歧。 但他们硬是扛下来了。 2026 年 4 月 24 日,DeepSeek V4 正式发布,官方技术报告里第一次把华为昇腾和英伟达 GPU 放在同等位置。更关键的是,V4 在昇腾平台上实现了 1.5 到 1.73 倍的推理加速,成为全球首个在国产算力上完成训练与推理验证的万亿参数模型。 这意味着什么?意味着国产算力第一次有了世界级软件生态撑腰,从芯片到模型,从训练到部署,形成了完整的国产闭环。 性价比更能说明问题。昇腾 950PR 芯片算力是英伟达 H200 的一半,价格却只有后者的三分之一到四分之一。性能不差、价格更低,换谁都会动心。 国内互联网巨头已经开始行动,阿里、字节、腾讯纷纷向华为下单数十万颗昇腾芯片。DeepSeek 之后,寒武纪、海光、摩尔线程等国产芯片厂商也宣布完成对 V4 的适配。 整个行业风向,一夜之间变了。 最着急的当然是黄仁勋。2026 年 4 月 16 日,他在播客采访中公开抱怨美国的芯片管制政策,直言 “芯片又不是浓缩铀,卖给中国怎么了?” 他很清楚,中国市场占英伟达收入的五分之一。更重要的是,一旦中国 AI 企业集体转向国产算力,英伟达失去的不只是市场,还有整个生态的主导权。 黄仁勋在采访中说得很直白:“如果 DeepSeek 率先在华为上发布,那对美国来说将是一个可怕的结果。” 他急的不是芯片卖不出去,而是美国赖以遏制中国 AI 发展的 “生态枷锁”,被梁文锋一脚踹开了。 这件事的深层意义,远不止一家公司换了芯片。 它标志着中国 AI 产业正式进入 “去英伟达化” 的新阶段。过去我们总说 “自主可控”,但很多时候停留在口号上。DeepSeek 用实际行动证明,顶级大模型完全可以在国产算力上跑通、跑顺、跑快。 更重要的是,它打破了行业的固有认知:“高端 AI 训练只能依赖英伟达”。这条路一旦走通,其他国产模型公司会纷纷跟进,形成示范效应。 以后再有人想通过断芯片卡中国 AI 的脖子,就得好好掂量掂量 —— 我们已经有了自己的路,你不给,我们照样能走。 当然,这条路不是没有挑战。华为昇腾的 CANN 生态和 CUDA 相比,成熟度还有差距,工具链、第三方库支持都还需要完善。对小团队来说,迁移成本依然很高。 但方向已经明确,步伐已经迈出。梁文锋的 “掀桌”,不是一时冲动,而是看清大势后的果断选择。美国越封锁,中国越要自立;别人越卡脖子,我们越要把命运握在自己手里。 未来几年,我们会看到越来越多国产大模型跑在国产芯片上,形成 “国产模型 + 国产算力” 的完整闭环。到那时,中国 AI 才能真正摆脱外部依赖,在全球竞争中拥有更多底气和话语权。 梁文锋和 DeepSeek 做的,不是简单的技术迁移,而是为中国 AI 撕开了一道口子,照亮了一条独立自主的路。这条路,注定不会好走,但走过去,就是一片新天地。 参考:DeepSeek华为腾全国产AI 生态突围——中国经营网
