英伟达Blackwell(B200/GB200)和谷歌TPUv7(Ironwo

未言近韧劲 2025-12-05 20:28:33

英伟达Blackwell(B200/GB200)和谷歌TPU v7(Ironwood)的核心参数对比: 英伟达Blackwell系列的B200和GB200是其新一代AI算力核心,B200在FP8精度下的核心算力达4500 TFLOPS,GB200则提升至5000 TFLOPS。该系列均配备192GB HBM3e内存,内存带宽高达8TB/s,依托第五代NVLink技术实现1.8TB/s的双向互连带宽,最多可连接72个芯片组成NVL72架构集群。其中GB200超级芯片针对大语言模型推理负载,能实现30倍的性能提升,并将成本和能耗降低25倍。 谷歌TPU v7(Ironwood)聚焦AI推理场景,FP8精度下的峰值算力为4614 TFLOPS,配备192GB HBM3e内存,内存带宽为7.2TB/s,功耗约1000W,能效比达每瓦29.3 TFLOPS,是其前代Trillium的2倍,也是英伟达B200的2倍以上。它通过3D Torus拓扑与OCS光交换技术,单集群可支持9216个芯片协同工作,芯片间ICI技术实现1.2Tbps双向带宽,最高配置的集群总算力可达42.5 ExaFLOPS,相当于全球最强超算ElCapitan的24倍,在大规模LLM训练和超算场景中优势显著。

0 阅读:0

猜你喜欢

未言近韧劲

未言近韧劲

感谢大家的关注