梁文锋又冲上热搜了! 这次既不是团队内讧也不是技术翻车, 反倒给AI圈扔了颗惊雷。而是他们居然又 开发了新的模型!1月21日外媒曝光,梁文锋在DeepSeek发布推理模型R1一周年之际,新模型“MODEL1”的项目名在开源社区悄然出现。 梁文锋几乎是把当年在金融市场里拼杀出来的生存法则,一字不差地搬到了人工智能的新牌桌上。 可一个绕不开的问题是:2021年还掌管着千亿规模基金的梁文锋,为什么两年后会一头扎进通用人工智能这个公认的烧钱行当? 这事要从2015年的金融市场讲起,那一年,梁文锋的幻方科技,正是靠着高频量化交易,在市场的剧烈波动中站稳了脚跟。 高频交易,争的就是毫秒级的胜负。算法要快,硬件基础设施必须更硬。谁的算力更强、谁的网络延迟更低,谁就是赢家。 这个刻在骨子里的认知,让他比绝大多数AI创业者都更早、更透彻地看清了算力的决定性价值。 2018年,幻方全面转向AI投资,对算力的渴求几乎成了一种本能。2019年,他们就投入近2亿元,自研了“萤火一号”超算平台。 仅仅两年后,又追加10亿元升级到“萤火二号”,内部署了上万张顶级的显卡。 这些布局在当时是为量化交易服务,但现在回头看,无异于为今天的DeepSeek提前准备好了一副无比强大的心脏。 于是,他手里已经握着一个庞大的算力集群时,进军通用人工智能就成了一个无比自然的选择。这种“基建先行”的思路,是他从金融战场上带来的铁律,也是他整个战略的基石。 砸钱建算力是硬碰硬的实力,而DeepSeek发布后的一系列开源动作,则是精巧的布局。 去年12月,他们的模型就已经用非常低的成本,实现了顶尖的性能,这本身就是对行业里“资源决定论”的一次挑战。而紧随其后的模型开源,则是一步更深远的棋。 在金融市场,信息差和技术壁垒能创造超额利润。如今的AI领域,少数几家大公司通过闭源模型和API接口,也建起了类似的护城河,赚取着高昂的技术服务费。 梁文锋的选择,是用彻底的开放来冲破这个格局。 他将R1等核心模型直接开放给所有人使用,表面看是放弃了唾手可得的利润,实际上是主动打开闸门,把全世界的开发者都吸引到自己的身边,快速围绕DeepSeek形成一个全新的生态。 梁文锋的行事风格,似乎也能看到一些地域上的共性。巧合的是,AI圈另外两位备受瞩目的代表人物,月之暗面的杨植麟和学术界的何恺明,都来自广东,身上都流露着一种相似的气质:专注于解决最根本的难题。 92年出生的杨植麟,一创业就选择去啃“长文本”这块最难的骨头。他的产品Kimi助手,因为能处理20万汉字的超长输入,一发布就引爆了市场。 而早已声名显赫的何恺明,无论是当年凭借深度残差网络ResNet横扫2015年ImageNet竞赛,还是之后持续的学术探索,他的目光始终锁定在对底层技术框架的颠覆与重塑上。 他们和梁文锋一样,都重研发、轻包装,把真正的技术突破视为第一驱动力。这或许只是巧合,但也确实表明,在中国AI圈,有一股踏实做事的力量正在浮现。 1月27日,DeepSeek的应用下载量一度冲到中国和美国两国应用商店榜首,甚至超过了ChatGPT。这不单是一个产品的短暂火爆,它证明了这整套打法的有效性。 梁文锋和DeepSeek的出现,为中国AI的发展路径,提供了一个非常规的样本。他先用真金白银构筑了底层基础设施的绝对优势,再用开放的生态策略,打出了一场漂亮的“非对称”竞争。 这或许说明,决定人工智能这场全球竞赛胜负的,除了代码和数据之外,更关键的,可能是藏在背后的战略思考 信息来源:《DeepSeek新模型真的要来了?“MODEL1”曝光》,第一财经,2026年1月21日。


