算力差距啊……DeepSeek-V4-Pro 的预训练计算量可粗略估为约 1e25 FLOPs。若拿 OpenAI的 10 万台 GB200 ,哪怕只用约 15% 的平均有效利用率,完成等量计算只需要约 37 小时。
AI创造营How I AI

算力差距啊……DeepSeek-V4-Pro 的预训练计算量可粗略估为约 1e25 FLOPs。若拿 OpenAI的 10 万台 GB200 ,哪怕只用约 15% 的平均有效利用率,完成等量计算只需要约 37 小时。
AI创造营How I AI

猜你喜欢
【1评论】【1点赞】
【1评论】
【10评论】【6点赞】
作者最新文章
热门分类
科技TOP
科技最新文章