📑花旗：DeepSeek-V4模型对中国互联网巨头模型格局的影响✨以D

犇犇牛V 2026-04-25 16:58:45

📑 花旗：DeepSeek-V4 模型对中国互联网巨头模型格局的影响

✨ 以 DeepSeek-V4 今日发布为代表的中国开发者 AI 模型快速迭代，凸显了当前竞争格局的特点。💬 我们认为市场领先并非 “赢者通吃”，成功的关键因素将更多是商业化策略、持续用户采纳以及通过 API、代币使用和基础设施服务产生收入。🏢 企业或将采取务实的多模型策略，根据对质量、能力和成本的细致评估，为特定任务选择最佳工具。🔧 差异化的技术路径包括腾讯专注于真实应用场景的模型、阿里专注复杂编码与推理的模型等。🚀 DeepSeek-V4 的先进架构信号了更广泛的趋势：技术差距正在缩小，中国头部模型正日益成为其全球顶尖同行的可行替代方案。📈 这将加剧竞争，为企业提供更多强大且具成本效益的选择，维持对阿里和腾讯的买入评级。📰 最新动态📅 2026 年 4 月 24 日，DeepSeek 宣布已正式发布其最新模型 DeepSeek-V4 的预览版本，并在开源开发者平台上线。🔢 这是一款万亿参数混合专家模型，具备成本效益的 100 万上下文长度。🔍 V4-Pro 版本为 1.6 万亿参数（490 亿激活参数），性能可与 GPT-5.4 和 Opus 4.6 的最新表现相媲美。⚡ V4-Flash 版本为 2840 亿参数（130 亿激活参数），面向高效经济的场景应用。⚙️ 架构升级与优化🔧 具体而言，DeepSeek 指出其 V4 系列模型包含了关键升级：1️⃣ 混合注意力架构，结合压缩稀疏注意力与重度压缩注意力，提升长上下文处理效率。2️⃣ 流形约束超连接技术，增强传统残差连接的效果。3️⃣ 缪子优化器，实现更快的收敛速度和更高的训练稳定性。📊 公司表示，在百万 token 上下文设置下，DeepSeek-V4-Pro 所需的单 token 推理计算量仅为 DeepSeek-V3.2 的 27%，键值缓存仅为其 10%。💡 这一改进至关重要，因为它使公司能够常规支持百万 token 上下文，并使长周期任务和测试时间扩展变得更加可行。🏆 能力与排名📚 DeepSeek 声称，其 V4-Pro 在丰富的世界知识方面领先所有当前开源模型（Gemini-3.1 除外），并在数学、科学、编码方面击败所有当前开源模型，可与现有顶尖闭源模型相抗衡。🤖 对于 V4-Flash 版本，其在简单智能体任务上的表现可与 V4-Pro 持平。财经观察官

0 阅读：0