昨晚饭局,一位刚离职的DeepSeek核心工程师喝多了说:梁文锋能当选全球十大科学人物,是因为他做了一件同行不敢想的事。 这位工程师没说透,但圈内人都清楚,那件“不敢想的事”,就是把顶尖AI模型彻底开源,还把训练成本压到了同行不敢信的地步。 圈子里都传疯了。梁文锋刚刚上了《自然》杂志的年度十大科学人物榜。他的公司叫深度求索。大家都叫他“科技颠覆者”。这个名头可不是白来的。 他干了什么事?说出来吓人。现在做大模型,就是比谁钱多。OpenAI训练GPT-4,听说花了几亿美元。谷歌、Meta也差不多。大家默认了,没钱就别玩。 梁文锋偏不认这个理。他做的DeepSeek-R1模型,训练成本低得离谱。多少钱?29.4万美元。你没听错,就是二十九万四千美元。这还没完,他训练上一个版本DeepSeek-V3,总共也就花了五百多万美元。只有别人家的一个零头。 钱花得少,东西却一点不差。他的模型会“推理”。比如解数学题,能自己一步步想。在美国数学邀请赛上,正确率从开始的15.6%,自己练到了86.7%。比一般人的平均成绩高多了。 这还不够。最狠的一招来了。梁文锋把这个顶尖模型,免费公开了。对,开源了。谁都能下载,谁都能用,谁都能改。现在在Hugging Face上,下载量超过一千万次。成了最受欢迎的开源模型。 这等于把武林秘籍印成传单,满大街发。那些把技术锁在保险柜里的大公司,脸都绿了。他凭什么这么敢?秘密藏在方法里。他的方法叫“纯强化学习”。听起来玄乎,道理挺简单。 以前教AI,像教小孩做数学题。得把每一步都写出来,让它照着抄。梁文锋的团队不这样。他们只告诉AI答案对不对。具体怎么想,AI自己去琢磨。 结果呢?这个没人管的AI,自己学会了反思。训练时,研究人员甚至观察到模型突然开始频繁使用“wait”这个词,像人一样停下来思考。它有了“顿悟时刻”。自己琢磨出了解题的方法。这条路走通了,成本自然就下来了。 方法牛,成本低,还全部开源。这套组合拳打蒙了全世界。连最权威的《自然》杂志,都把他的论文登上了封面。这可是第一个经过严格同行评审的主流大模型。给行业立了规矩。 当然有人不服。 OpenAI那边就有人嘀咕,说他是不是用了别人的数据来训练。面对这些质疑,梁文锋团队这次在《自然》的评审过程里直接回应了。他们说没有模仿任何人的推理轨迹。评审专家也认为,他们的方法本身已经足够优秀。 梁文锋的路不是一天走出来的。他是广东湛江人。以前是做量化金融的,管过上千亿的资金。2023年,他带着一百多人的小团队,一头扎进AI大模型。那时没人看好。 但他就是做成了。用极少的钱,极聪明的方法,做出了顶尖的东西。然后免费送给全世界。他改变了游戏规则。以前大家拼谁的金库深,现在得拼谁的脑子活。 他像一条鲶鱼,闯进了池塘。把一潭死水搅活了。他自己却说:“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。” 各位读者你们怎么看?欢迎在评论区讨论。
