昨晚饭局，一位刚离职的DeepSeek核心工程师喝多了说：梁文锋能当选全球十大科

落叶无风 2025-12-12 15:41:15

昨晚饭局，一位刚离职的DeepSeek核心工程师喝多了说：梁文锋能当选全球十大科学人物，是因为他做了一件同行不敢想的事。这位工程师没说透，但圈内人都清楚，那件“不敢想的事”，就是把顶尖AI模型彻底开源，还把训练成本压到了同行不敢信的地步。圈子里都传疯了。梁文锋刚刚上了《自然》杂志的年度十大科学人物榜。他的公司叫深度求索。大家都叫他“科技颠覆者”。这个名头可不是白来的。他干了什么事？说出来吓人。现在做大模型，就是比谁钱多。OpenAI训练GPT-4，听说花了几亿美元。谷歌、Meta也差不多。大家默认了，没钱就别玩。梁文锋偏不认这个理。他做的DeepSeek-R1模型，训练成本低得离谱。多少钱？29.4万美元。你没听错，就是二十九万四千美元。这还没完，他训练上一个版本DeepSeek-V3，总共也就花了五百多万美元。只有别人家的一个零头。钱花得少，东西却一点不差。他的模型会“推理”。比如解数学题，能自己一步步想。在美国数学邀请赛上，正确率从开始的15.6%，自己练到了86.7%。比一般人的平均成绩高多了。这还不够。最狠的一招来了。梁文锋把这个顶尖模型，免费公开了。对，开源了。谁都能下载，谁都能用，谁都能改。现在在Hugging Face上，下载量超过一千万次。成了最受欢迎的开源模型。这等于把武林秘籍印成传单，满大街发。那些把技术锁在保险柜里的大公司，脸都绿了。他凭什么这么敢？秘密藏在方法里。他的方法叫“纯强化学习”。听起来玄乎，道理挺简单。以前教AI，像教小孩做数学题。得把每一步都写出来，让它照着抄。梁文锋的团队不这样。他们只告诉AI答案对不对。具体怎么想，AI自己去琢磨。结果呢？这个没人管的AI，自己学会了反思。训练时，研究人员甚至观察到模型突然开始频繁使用“wait”这个词，像人一样停下来思考。它有了“顿悟时刻”。自己琢磨出了解题的方法。这条路走通了，成本自然就下来了。方法牛，成本低，还全部开源。这套组合拳打蒙了全世界。连最权威的《自然》杂志，都把他的论文登上了封面。这可是第一个经过严格同行评审的主流大模型。给行业立了规矩。当然有人不服。 OpenAI那边就有人嘀咕，说他是不是用了别人的数据来训练。面对这些质疑，梁文锋团队这次在《自然》的评审过程里直接回应了。他们说没有模仿任何人的推理轨迹。评审专家也认为，他们的方法本身已经足够优秀。梁文锋的路不是一天走出来的。他是广东湛江人。以前是做量化金融的，管过上千亿的资金。2023年，他带着一百多人的小团队，一头扎进AI大模型。那时没人看好。但他就是做成了。用极少的钱，极聪明的方法，做出了顶尖的东西。然后免费送给全世界。他改变了游戏规则。以前大家拼谁的金库深，现在得拼谁的脑子活。他像一条鲶鱼，闯进了池塘。把一潭死水搅活了。他自己却说：“我们不是有意成为一条鲶鱼，只是不小心成了一条鲶鱼。” 各位读者你们怎么看？欢迎在评论区讨论。

0 阅读：55