人工智涨ultra的行业观察
DeepSeek V4并不是由昇腾芯片训练出来的。。。
Deepseek在技术报告里面说的:
We validated the fine-grained EP scheme on both NVIDIA GPUs and HUAWEI Ascend NPUs platforms
翻译:我们在英伟达GPU和华为昇腾NPU两个平台上均验证了细粒度专家并行(EP)方案。
这是推理过程。。
想要知道他是什么平台训练的,得看到训练代码,日志,损失曲线,这些在开源的文件中没有。
昇腾独特的FP8/Fp4混合精度推理体系,确实能够让V4有非常牛逼的推理吞吐。后续国内同行也会跟进。
所以,昇腾和DS4的这次合作,涉及不到打破CUDA护城河,挑战英伟达壁垒等愿景。。。
首先CUDA是用来造模型和通用计算,也就是训练和科学计算的并行计算开发。而是我们卡了英伟达的脖子,他后面卖不进来了
如果真用纯国产芯片,不论是昇腾,海光还是其他的训练出这种规模和能力的模型,那纳斯达克要崩……
所以营销号说得那些。。。
谁说拉黑谁。。。