近日,中科曙光的高速网络系统产品scaleFabric在圈内火了一把!!!其中,有三个判断让我感慨颇多。而这三个趋势,都和scaleFabric息息相关。
第一个趋势:硬件参数持续突破。这次最让我意外的不是带宽,而是scaleFabric的并发能力。单卡QP支持856K,是英伟达CX-7的6.7倍,这意味着在复杂的多任务并行场景下,scaleFabric能撑起更大的压力。下一代800G交换芯片已经在研发中,带宽差距正在快速缩小。
第二个趋势:软件生态是长期赛点。CUDA的壁垒确实高,不是一朝一夕能打破的。但scaleFabric跑的不是别人的协议,是自研RDMA Fabric,SuperTunnel也不是抄作业,是原创优化。架构师说了一句话很实在:“生态不是写出来的,是跑出来的,是靠一个个模型适配、一行行算子优化堆出来的。scaleFabric就是在跑生态。”
第三个趋势:“国产化”正在升级为“自主创新”。以前我们习惯对标NVIDIA,别人有什么我们也要有什么。但scaleFabric不一样——iLossless没有照搬PFC,而是自研流控;SuperTunnel不是静态配置,而是动态感知;ScaleOS不是套壳,是从头写的网络操作系统。这些都不是复制,而是创新。
最后分享一组scaleFabric的里程碑数据:最大组网11万卡,下一代800G在研,郑州集群36小时上线。国产AI基础设施还有很长的路要走,但scaleFabric这条路上,已经有了真正扎实的脚印。
总的来说,国产网络这波真的给了大家太多惊喜,给一个大大的赞!!!
