智能体对互联延迟或高于带宽，跨机房光互连需既快，更要低延迟当前大模型推理，尤

财旺毓美美 2026-06-04 06:27:22

智能体对互联延迟或高于带宽，跨机房光互连需既快，更要低延迟当前大模型推理，尤其是MoE模型的瓶颈早已从浮点运算转向内存带宽与容量。HBM的昂贵和产能限制，催生了Grace CPU的大容量LPDDR内存池设计。内存→连接：当模型和数据无法塞进单一节点，互连带宽就成了墙。NVLink在机柜内解决，但跨机柜、跨数据中心就必须用光互连。铜不够长是物理定律——铜缆在56G以上速率时，3米内可用；而数据中心间距动辄几百米，必须走光。连接→多数据中心：智能体需要同时访问内部CRM、外部网页、向量数据库等，这些往往物理隔离。跨地域的DCI，数据中心互联，需求因此爆发，这正是高阶DSP+硅光+光模块的应用场景。三芯架构的针对性设计，Vera CPU：传统x86在精细化调度、低延迟上下文切换上并不差，但NVIDIA推自有ARM CPU的核心在于——把CPU与GPU通过NVLink-C2C直连，共享统一内存地址，消除PCIe瓶颈。这对智能体频繁的调用-执行-返回循环至关重要。 Rubin GPU：相比Blackwell，为MoE批推理优化，Rubin会大幅强化多上下文并行能力，因为智能体同时处理多个用户、多个工具调用会话。 CX（ConnectX）：这其实是三芯中最易被忽视的一环。它本质上是一块数据搬运专用DPU，负责RDMA、加密、遥测。在跨机房场景下，CX直接管理光模块和拥塞控制，效率远高于靠CPU中断处理网络包。关于LPO与DSP的取舍，LPO，线性驱动可插拔光模块，去掉DSP，功耗和延迟大幅降低，适合机柜间

0 阅读：1

财旺毓美美

感谢大家的关注

作者最新文章

1

全球官储从单一美元向黄金与多元货币转型，黄金成央储占比第一透过2025年末全

2

天上掉钱时刻往往出现在市场极端偏见形成、而事实即将纠正的前夜我们可以关注当前

3

国家七万亿投入会先采购国产设备，算力网最先带动爆发会是光模块算力网的本质是把

4

智能体对互联延迟或高于带宽，跨机房光互连需既快，更要低延迟当前大模型推理，尤

5

韩国五月制造业整体景气度呈表面强劲，扩张加速，背后会否存隐忧透过韩国5月制造

6

关于中外专家们预测美股大概率会大幅回调，引发投资者忧虑，何解目前中外各种专家

7

居民加速从存款转非银金融，反映再配置需求，金融市场吸引力增强对比2026年4

8

房产周期与通胀走势高度相关，货币政策需更关注通缩而非仅防通胀房地产下行伴随通

9

从地缘战略、科技突围和宏观心态看美国战略透支与中俄伊被动靠近美国无法同时应对

10

美国PPI从回落到急速反弹，背后有何驱动因素，会否增加滞胀担忧 2023-20

财经TOP

1

5月14日游资龙虎榜

2

美不胜收2109

3

我感觉中国75%的厨余，都能出口到小日子了

4

炸锅！长鑫科技IPO恢复审核，净利330亿！概念股全名单曝光长鑫科技IPO恢

5

这半年来股市跌得也太惨咯。

6

行情不好，分享一下我的一页自选股……

7

三年过去了，虽然位置没变，但资产却发生了变化

8

A股又出新概念，政策性利好已经下达，市场巨大村里正式发文，要从大海里多找新药、好

9

国企综合成绩第一然后打电话去问说不招了

10

机构抱团核心品种梳理

财经最新文章

1

8元以下低位首板潜力个股，谁能连板1、第一名：达实智能现价5.21元，历史最高价

2

这绝对是A股最恶心的板块几个龙头的动态pe全部在13左右，甚至更低，不知道的

3

老铁们，周末这两天，消息面一点也不平静。本不想打扰大家休息，但看到两个重磅信号，

4

瓜达尔港项目合作格局或将迎来变动！巴方正式提出想要调整港口运营收益的分成比例，希

5

证监会发布重磅利好，终于开始注意量化程序化交易了，开始保护投资者权益量化、机器自

6

这哪是鸡汤，是心中那股狠劲被人点破的感觉

7

暴涨的股票，通常情况下你拿不走利润，这就是市场规律！要是追涨，而且买的不是龙头，

8

#银行理财密集提前“止盈”#5月以来，工银理财、苏银理财、招银理财等多家机构陆续

9

这个市场确实很畸形。给大家讲个路边听来的故事吧：阿C的企业有很多股东，这么多

10

分享一个技巧：最近为了稳定情绪，股市的负面情绪会卡，但可以切成印度股市，然后正常