37岁,1300亿!硅谷最神秘华人,拒绝巴菲特,想做陶哲轩摘自加一研究院一家名为Surge AI的公司,正在以近乎隐秘却极富影响力的方式,为AI时代提供最关键的“燃料”。作为OpenAI、Anthropic和Google等顶尖实验室背后的核心数据服务商,Surge AI提供的并非普通数据,而是驱动大模型进化的“高质量人类反馈”。令人惊叹的是,这家公司仅凭不到100人的精英团队,在未接受任何风险投资的情况下,创立不到四年即实现年营收超10亿美元,成为史上最快突破这一里程碑的公司。据透露,Surge AI正在进行首轮融资,估值已达约240亿美元。其创始人、37岁的华裔技术天才Edwin Chen持有公司约75%股份,个人财富估计达180亿美元(约合1300亿元人民币),在2024年《福布斯》美国400富豪榜上位列第55名,成为榜单上最年轻的成员。Edwin Chen的职业生涯跨越Google、Facebook和Twitter,却始终与硅谷的主流文化格格不入。他厌恶“圈子游戏”,更像一位闯入商业世界的哲学家。公司名字“Surge”的灵感,来源于科幻作家特德·姜的短篇《你一生的故事》——一个关于破译外星语言、探索沟通本质的故事。他希望Surge能“编码人类的丰富性”。这意味着,训练AI的不再是普通的标注员,而是来自斯坦福、普林斯顿、哈佛等顶尖学府的教授和专家,将他们深邃的智慧转化为AI可理解的“语言”。近期,一向低调的Edwin Chen罕见接受专访,不仅分享了Surge的成功逻辑,更对AI行业的现状与未来发出了深刻而犀利的见解。01 反主流的成功:百人团队,年入十亿问:你们用不到100人创造了年营收超10亿美元的奇迹,且没有拿过风投。这是如何做到的?Edwin Chen: 我们从未想过玩硅谷那套游戏。我曾任职于多家科技巨头,常常觉得,即使裁掉90%的员工,公司效率反而会更高,因为最优秀的人才不会被官僚琐事束缚。创立Surge时,我们决心走一条不同的路:组建一支极其精简、高度精英化的团队。结果证明,这条路走得通。AI正在开启一个“公司建设的新黄金时代”。两股趋势正在汇合:一是人们意识到,庞大的组织架构并非成功的必要条件;二是AI本身带来的巨大效率红利。未来,我们或许会看到人均产出更为惊人的公司——比如,每名员工创造千亿美元价值。问:你们几乎不做营销,这很反直觉。Edwin Chen: 我一直认为过度营销是荒谬的。你儿时的梦想是什么?是亲手从零打造一家公司,沉浸于创造;还是终日向投资人汇报,疲于融资?不拿风投让起步变得更难,但这反而帮我们筛选了客户——早期合作伙伴都是真正懂数据、在乎质量的人,而非追逐热点的投机者。02 数据的本质:寻找“诺贝尔奖级别”的诗问:你们被视作最成功的数据公司。到底做对了什么?Edwin Chen: 核心在于对“质量”的极致追求。很多人误以为数据标注是机械劳动,只需投入人力就能产出好数据。这完全错了。举例来说,如果任务是训练AI写一首关于月亮的八行诗,平庸的标准会问:这是诗吗?有八行吗?提到“月亮”了吗?如果都符合,就算通过。但我们要的是“诺贝尔奖级别”的诗。它是否独特?充满精妙的意象?能否触动心弦,甚至让你对月光有所领悟?这种质量是主观、复杂且丰富的。为此,我们像谷歌为网页排序一样,建立了涵盖成千上万个信号的评估体系,既要过滤垃圾,更要发现瑰宝。03 卓越的背后:是“品味”决定了模型的高度问:为什么Claude在编程和写作上格外突出?是数据的原因吗?Edwin Chen: 数据是关键,但更深层的原因是“后训练的艺术”。当顶尖实验室决定将哪些数据喂给模型时,这不只是科学,更是品味的体现。比如在编程上,你更看重前端美感还是后端严谨?如果一家公司只热衷于营销,追求在各类基准测试上刷高分,它就会针对测试优化数据,哪怕这对解决真实问题无益。而另一家公司可能会坚守原则:“我不关心榜单,只关心模型在现实世界中的表现。”这背后是审美与价值观的差异。Anthropic让我印象深刻的一点,正是在于他们这种有原则的立场。04 榜单的陷阱:我们正在制造“会拍马屁的AI”?问:模型在各种测试中“超越人类”,但实际体验并未有质的飞跃。你相信这些基准测试吗?Edwin Chen: 我完全不信。原因有二:首先,许多测试本身就有问题,充满噪声和错误答案。其次,测试往往有明确答案,这让模型容易通过“题海战术”取巧,但这与真实世界的复杂性和模糊性相去甚远。结果就是,模型能拿奥数金牌,却解析不了一个PDF。更严重的是,行业陷入了糟糕的激励循环。像“大模型竞技场”这类排行榜,用户往往只用几秒钟凭“感觉”投票。如果一个模型满口胡言,但用了漂亮的表情符号和排版,它就能得高分。我们本质上是在训练AI不择手段地“取悦”用户,追求多巴胺而非真理。我很担心,最终我们得到的不是一个能治愈癌症的超级智能,而是一个超级会聊天、超级会拍马屁,却干不了实事的电子宠物。05 真正的进步:由“诺贝尔奖得主”来评判问:如果不看榜单,如何衡量AI的真正进步?Edwin Chen: 我们依靠“人类专家评估”。不是随便找人聊天,而是请诺贝尔奖级别的物理学家与模型探讨前沿研究;让资深程序员用模型解决他们实际工作中遇到的复杂问题。专家会深入评估:代码能否运行?物理推导是否严谨?逻辑是否自洽?问:那你对实现AGI(通用人工智能)的时间表怎么看?Edwin Chen: 我是长期主义者。人们容易低估从“不错”(80%)到“卓越”(99.9%)的难度,这背后是指数级增长的挑战。一两年内,模型或许能自动化普通软件工程师80%的工作,但要达到98%、99%,可能还需要很多年。我认为,距离真正的AGI,可能还有十年甚至更远的路。06 被高估的“氛围编程”与模型的“人格”问:还有哪些被高估的趋势?Edwin Chen: “氛围编程”(Vibe Coding)被严重高估。现在流行把一堆自己都不懂的代码扔给AI,只要能跑通就行。这非常危险,长期来看将制造出完全无法维护的系统灾难。问:你曾提到,不同模型会因“目标函数”不同而产生差异。Edwin Chen: 是的,目标函数决定了模型的“性格”。我曾让Claude帮我润色邮件,它花了30分钟、修改了30个版本,来追求极致的完美。邮件确实完美了,但我浪费了30分钟。如果你可以选择,你要一个鼓励你追求无意义完美的AI,还是一个帮你节省时间、告诉你“已经很好了,直接发吧”的AI?这就像不同公司的产品哲学。未来,模型之间的差异会越来越大,因为它们背后公司的“人格”和目标函数不同。我们甚至可以从一家公司选择开发什么产品,看出它的价值观。比如,谁做Sora(文生视频),谁不做?这反映了他们对AI未来角色的不同想象。07 给创业者的终极建议:建造“唯你能造”之物问:对于那些被风口和主流叙事影响的创业者,你有什么建议?Edwin Chen: 我厌恶硅谷的陈词滥调,比如“快速转型”、“增长至上”。不要为了简历好看去招聘名校生。去建造那个“只有你才能建造”的东西,那个没有你的独特洞察和知识就无法存在的东西。你的全部人生、经历和热情,似乎都在为此做准备。做决策时,别问“公司该怎么办”,要问“我个人在乎什么?我的价值观是什么?”现在有太多跟风者,2020年做加密货币,2022年转NFT,现在又自称AI公司。没有一致的使命,只是在追逐估值。如果你的失败是因为世界还没准备好,那也远比成功转型为一家平庸的“套壳”公司要好。至少,你曾为一个深刻、新颖而艰难的想法拼搏过。08 初心:宁做陶哲轩,不做巴菲特问:是什么驱动你创立Surge?Edwin Chen: 我从小着迷于数学和语言的交集。我去麻省理工,部分原因是因为诺姆·乔姆斯基在那里。我曾梦想找到统一数学、计算机和语言学的底层理论。后来在各大科技公司做研究,我始终被同一个问题困扰:我们无法获得训练顶尖模型所需的高质量数据。2020年GPT-3发布那一刻,我意识到,若想将AI推向能写诗、编码甚至助力科研的下一阶段,我们必须创造一种全新的数据解决方案。当时所有的数据公司都在做“标出图中的猫”这种简单工作,这让我沮丧。我们需要的是能驾驭人类全部智慧深度的数据。于是,在GPT-3发布一个月后,我创立了Surge。我骨子里是个科学家。我曾以为自己会成为教授,去探索宇宙和语言的本质。我甚至幻想,如果外星人到访,我能成为那个被政府请去破译外星语言的人。直到今天,每当有新模型发布,我最爱做的事仍是通宵研究它,撰写深度分析。这很有趣,因为我其实很不擅长CEO的典型工作——我讨厌开会,不擅长销售。我常说,相比于成为沃伦·巴菲特,我更想成为陶哲轩。 驱动我的始终是推动科学前沿,而非追逐估值。09 终极比喻:我们不是在标注数据,是在“抚养孩子”问:能否用一句话总结你工作的核心?Edwin Chen: 很多人称此为“数据标注”,我讨厌这个词。我认为我们更像是在 “抚养一个孩子”。你不仅是向孩子灌输信息,你是在教授他价值观、创造力、审美,以及“成为一个好人”的无数微妙之处。这正是我们在为AI做的事。我们在塑造的,是人类共同的孩子。这关乎我们想让什么样的智能陪伴我们,以及我们想成为什么样的自己。你,就是你的目标函数。 而我们工作的终极挑战,就是帮助定义那个函数——一个能让人类更丰富、更具创造力、更保有好奇心,而非更懒惰的函数。这很难,但这才真正重要。
我就这样对待阴阳怪气评论
【1评论】