🔥【国联民生电子】Rubin推理新架构:推理态存储成为 NAND 的“新需求曲线”🚀在本次 CES 上,英伟达首次系统性披露 Inference Context Memory Storage(ICMS 推理上下文内存存储) 架构,在GPU HBM与传统 NVMe SSD之间引入一个面向KV Cache的独立高速存储层,用于承载warm/long context 状态。🚀该架构通过 NVLink 6 与高性能网络实现上下文的快速调度,本质上将原本高度挤占HBM的 KV Cache 下沉至更具性价比的存储介质。💡Rubin+ICMS的本质是把AI推理的核心消耗从HBM转移到NAND,或将拉动对于NAND的需求。🚀弹性测算:Rubin NVL72每个GPU自带1TB存储,存储机柜为每个GPU提供额外16TB,按照1000万颗Rubin GPU测算,则对应NAND增量为153EB,相比全球NAND存储1000EB出货量,增量约为15%。如果ASIC采用类似方案,NAND弹性有望达到30%以上。全球NAND供需缺口或将进一步放大 🎁投资建议:随着 Rubin 架构推动 KV Cache 系统性下沉,NAND 有望复制 HBM 在训练侧的成长路径,在推理侧打开新的中长期需求曲线,建议关注:NAND原厂及模组厂商: ➠美股:闪迪、美光➠A股:德明利、佰维存储、江波龙➠其他:铠侠、港股7709等
🔥【国联民生电子】Rubin推理新架构:推理态存储成为NAND的“新需求曲
雒城小七啊
2026-01-07 08:25:58
0
阅读:0