豆包打电话支持“边听边说”;DeepSeek专家模式支持上传文件 AI语音交互的革命来了,两个重磅更新同时炸场! 先聊聊这两件事分别是什么。 【豆包 × 全双工语音】 字节跳动在4月9日正式发布了原生全双工语音大模型 Seeduplex,并已在豆包 App 全量上线。 这次升级的核心,是把过去"你说完我再说"的半双工模式,彻底换成了"边听边说"的全双工框架。 简单说,就是以后跟豆包打电话,它能一边听你说话,一边思考、一边回应,节奏更像真人对话。 有两个关键能力值得重点关注: - 精准抗干扰: 误回复率和误打断率相比上一代减少了一半,背景噪音不再让它乱说话。 - 动态判停: 你在思考、犹豫的时候,它会耐心等;你说完的瞬间,它能快速接话,抢话比例下降了40%。 对话流畅度 MOS 分提升了12%,整体通话满意度提升了8.34%。 这不是小修小补,是语音交互逻辑层面的一次重构。 【DeepSeek × 专家模式上传文件】 DeepSeek 的专家模式也在同期完成了一次重要更新,正式支持上传文件。 App 端和网页端均已上线,具体参数如下: - 最多可上传 50个文件 - 每个文件上限 100MB - 支持各类文档和图片格式 需要注意的是,官方明确提示:目前仅识别文字内容,上传文件本质上是 OCR 提取文本,专家模式暂不具备原生视觉感知能力。 也就是说,图片里的文字它能读,但图片本身的内容它看不懂。 【我的判断】 这两个更新,指向同一个方向:AI 工具正在从"能用"快速迭代到"好用"。 豆包在打破语音交互的物理感割裂,DeepSeek 在补齐文档处理的基础能力缺口。 两家路径不同,但都在用实际动作告诉用户:产品还没到天花板。 我是 AI 魔术师,持续追踪每一个值得关注的 AI 变化。



