华为又一力作:昇腾950DT全面超越英伟达当前及未来旗舰产品 昇腾950DT所代表的算力跃迁,在多项核心指标上对标甚至超越了国际顶尖水平(特别是英伟达的旗舰产品),标志着国产算力在底层基础设施上具备了全球竞争力。 1. 对标水平:全面超越英伟达当前及未来旗舰产品 在超节点集群层面,基于昇腾950DT打造的Atlas 950超节点,在规模、总算力、内存容量和互联带宽等关键指标上,均大幅超越了英伟达今年下半年发布的NVL144(规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,互联带宽是其62倍)。即便与英伟达计划于2027年上市的NVL576相比,Atlas 950在各项指标上依然保持领先。 2. 实现跃迁的核心原因: 架构与精度的底层升级: 昇腾950DT微架构升级为SIMD/SIMT,原生支持FP8、MXFP8、MXFP4等低数值精度数据格式,并特别支持华为自研的HiF8(精度接近FP16,但速度更快)。这使得其在保持模型精度的同时,计算能力翻倍,内存占用降低逾50%。 自研HBM突破“内存墙”: 昇腾950DT首次搭载了华为自研的HBM HiZQ 2.0(内部代号“朱雀”)。其内存容量达到144GB,内存访问带宽飙升至4TB/s。这打破了海外在高端内存上的垄断,让国产芯片在处理海量数据吞吐时不再受制于数据传输瓶颈。 极致的互联带宽与超节点设计: 昇腾950DT的互联带宽达到2TB/s。通过灵衢全光互联技术,Atlas 950超节点可将8192张昇腾卡互联,总互联带宽高达16PB/s(超过全球互联网峰值带宽的10倍)。这种“军团作战”的系统级工程能力,有效解决了万卡互联的稳定性难题,支撑万亿参数大模型的稳定训练。 3.软硬协同与生态开放: 昇腾950DT针对智能驾驶等复杂场景进行了深度优化(如Decode+Training),并配合华为CANN编译器、Mind系列工具链的全面开源,大幅降低了开发者的迁移门槛,实现了从芯片、云服务到数据湖的全链条国产自主可控。
