豆包打电话支持“边听边说”；DeepSeek专家模式支持上传文件 AI语音交互的

AI科技事 2026-04-11 10:11:27

豆包打电话支持“边听边说”；DeepSeek专家模式支持上传文件 AI语音交互的革命来了，两个重磅更新同时炸场！先聊聊这两件事分别是什么。【豆包 × 全双工语音】字节跳动在4月9日正式发布了原生全双工语音大模型 Seeduplex，并已在豆包 App 全量上线。这次升级的核心，是把过去"你说完我再说"的半双工模式，彻底换成了"边听边说"的全双工框架。简单说，就是以后跟豆包打电话，它能一边听你说话，一边思考、一边回应，节奏更像真人对话。有两个关键能力值得重点关注： - 精准抗干扰：误回复率和误打断率相比上一代减少了一半，背景噪音不再让它乱说话。 - 动态判停：你在思考、犹豫的时候，它会耐心等；你说完的瞬间，它能快速接话，抢话比例下降了40%。对话流畅度 MOS 分提升了12%，整体通话满意度提升了8.34%。这不是小修小补，是语音交互逻辑层面的一次重构。【DeepSeek × 专家模式上传文件】 DeepSeek 的专家模式也在同期完成了一次重要更新，正式支持上传文件。 App 端和网页端均已上线，具体参数如下： - 最多可上传 50个文件 - 每个文件上限 100MB - 支持各类文档和图片格式需要注意的是，官方明确提示：目前仅识别文字内容，上传文件本质上是 OCR 提取文本，专家模式暂不具备原生视觉感知能力。也就是说，图片里的文字它能读，但图片本身的内容它看不懂。【我的判断】这两个更新，指向同一个方向：AI 工具正在从"能用"快速迭代到"好用"。豆包在打破语音交互的物理感割裂，DeepSeek 在补齐文档处理的基础能力缺口。两家路径不同，但都在用实际动作告诉用户：产品还没到天花板。我是 AI 魔术师，持续追踪每一个值得关注的 AI 变化。

0 阅读：36

豆包打电话支持“边听边说”；DeepSeek专家模式支持上传文件 AI语音交互的

不知道你们发现没，这两年人工智能很火，但不好找工作的，反而是计算机专业[捂脸

总结一下现在AI味最浓的词：

程序员微信群的现状，就是“控诉”开发AI大模型者为码奸，为啥？因为他们已经“

日本节目聊中日AI和机器人，有位日本女学者，本来挺认真地在那儿分析，一条一条列数

等待ai观众出现的那一天

AI正在杀死中产你有没有发现，身边那些曾经活得最滋润的人，最近开始焦虑了？

一张是ai，一张是实拍？可以看出区别吗？