英伟达把大模型装进笔记本跑120B大模型 NVIDIAGTCTaipei

含含谈科技 2026-06-02 00:04:15

英伟达把大模型装进笔记本跑120B大模型 NVIDIA GTC Taipei 2026发布了RTX Spark,一块消费级芯片,128GB统一内存,1 PFLOP的FP4 AI算力,可以在14mm薄的笔记本上本地运行120B参数大模型,无需联网,无需云端,直接在你的电脑里跑Agent。 为什么这件事是个分水岭?过去两年AI进展几乎全在云端Claude Code、Codex、GPT-4o,所有的强大都依赖服务器。ToC端的本地硬件几乎毫无进展。本地跑大模型最大的卡口是内存架构:CPU有系统内存,GPU有显存,中间靠PCIe连接,带宽差了30倍,模型稍微大一点就跑不动。苹果用统一内存解决了这个问题,但代价是放弃CUDA生态,全球99%的AI开源代码和工具链都是先在CUDA上写的,移植到Apple的MLX要等很久,训练和微调支持更是残缺。 RTX Spark第一次把统一内存和完整CUDA生态同时装进了消费级PC。英伟达还和微软联手重构Windows,为本地Agent运行提供原生身份认证、隔离防护和安全管控。Adobe针对RTX Spark重新设计了Photoshop和Premiere的核心架构,速度提升两倍,还支持Agent直接调用。 RTX Spark最大的竞争对手不是苹果,而是云。它真正要颠覆的逻辑是当推理和微调可以在本地完成,每个月给OpenAI和Anthropic续费的必要性就要被重新审视了。英伟达卖出一块芯片,可能终结了无数人每月订阅大模型API的习惯。这笔账,AI公司比用户更清楚。

0 阅读:0
含含谈科技

含含谈科技

感谢大家的关注