2026年4月24日,DeepSeek发布V4模型预览版,同步开源权重。发布共两

欣鸿既白 2026-05-16 21:24:08

2026年4月24日,DeepSeek发布V4模型预览版,同步开源权重。发布共两个版本:旗舰版V4-Pro总参数1.6万亿,激活490亿;经济型V4-Flash总参数2840亿,激活130亿,均支持百万token上下文。更让市场震动的是定价——V4-Flash输出价格2元人民币/百万token,折合不到0.3美元,而前一天OpenAI刚上线的GPT-5.5定价30美元/百万token。 真正让英伟达坐不住的,不是跑分,是这件事:DeepSeek首次把华为昇腾芯片和英伟达芯片并列写进硬件验证清单。梁文峰特意推迟发布三个月,专门对华为昇腾芯片做模型重构。 黄仁勋在2026年4月的播客访谈中直言:“如果DeepSeek先在华为平台上发布,那对我们国家来说将是灾难性的。”V4发布后,华为同步宣布昇腾超节点全系列产品已实现对DeepSeek-V4的全面支持。 这个人是谁?梁文峰,1985年生于广东湛江,浙大本硕毕业。2015年创立幻方量化,用6年把7人小团队做成管理规模超千亿的量化机构。2023年7月,他抽调幻方几乎所有技术力量,押上全部身家创办DeepSeek,在杭州开启了一场不被任何人看好的豪赌。 DeepSeek研发团队几乎全部成员都在中国本土完成高等教育,海归比例不足5%。平均年龄28岁,靠一群应届博士生和硕士生,做出了让硅谷最有权势的人坐不住的东西。 这批人用实际行动打破了一个流传多年的偏见:顶尖AI不一定要在硅谷诞生。 在DeepSeek爆发之前,人才的天平已经开始倾斜。H-1B签证中国籍毕业生中签率仅有11.7%。与此同时,2025年选择回国求职的中国应届留学生较上年增长12%,自2018年以来已翻倍。一项针对海外在读博士生的调查显示,毕业后计划回国发展的比例从2024年的38%跳升至2025年的59%。 潘子正就是一个典型。他在英伟达实习4个月后拿到全职邀约,最终选择加入当时只有3人的DeepSeek多模态团队。哈佛大学教授Graham Allison在X平台发文,将他比作“AI界的钱学森”,痛心追问:“是谁错失了DeepSeek?” V4发布后,市场的反应几乎是即时的。阿里云、腾讯云完成基于华为昇腾芯片的全栈部署。字节跳动随后抛出56亿美元采购单——这是中国半导体市场有记录以来最大单笔AI芯片采购。 这不是单颗芯片的胜利,而是一整套国产算力体系成熟了。适配的华为昇腾推理芯片,采购价格仅为英伟达的四分之一,单卡算力却比特供版提升了2.87倍。 以前国产芯片要靠打折换市场,现在是加价也要抢。华为已公开技术路线图,2027至2028年将推出昇腾960、970系列,正向迭代的循环已经启动。 对普通人来说,这意味着未来手机、电脑、汽车所用的芯片,不会再轻易因外部原因断供涨价,AI应用的使用成本也将随之下降。 这条路还很长。V4在编程等部分能力上仍有差距。完整的大规模预训练体系,可能还需要等待下一代国产芯片的成熟。但有一件事已经确定:方向变了。以前是死结,再有钱也买不到关键技术;现在是时钟,每一天都在向前走。 全球最值钱的那批大脑,已经开始把职业生涯押注在这片土地上。钱跟着人走,机会跟着人走,未来也跟着人走。这,就是这个时代最硬的逻辑。

0 阅读:12

猜你喜欢

欣鸿既白

欣鸿既白

感谢大家的关注