刚刚,NVIDIA在 Hugging Face 放出了最新的 Audio Flamingo 3 ,完全开源、免费下载、可商用。
这个模型到底有多厉害?它能同时“听懂”人声、环境音和音乐,还能像语言模型一样做推理分析。官方测试直接刷新了 20+ 项音频理解任务的全球基准,领先幅度不是一点点。
最爽的是它的开源策略:开发者可以直接调用,不用担心 API 限额和费用,对做语音识别、声音理解、智能助手、音乐检索的团队来说,这一波能直接节省很大一笔研发成本。

刚刚,NVIDIA在 Hugging Face 放出了最新的 Audio Flamingo 3 ,完全开源、免费下载、可商用。
这个模型到底有多厉害?它能同时“听懂”人声、环境音和音乐,还能像语言模型一样做推理分析。官方测试直接刷新了 20+ 项音频理解任务的全球基准,领先幅度不是一点点。
最爽的是它的开源策略:开发者可以直接调用,不用担心 API 限额和费用,对做语音识别、声音理解、智能助手、音乐检索的团队来说,这一波能直接节省很大一笔研发成本。

猜你喜欢
【56评论】【76点赞】
【4评论】【10点赞】
【2评论】【1点赞】
【39评论】【60点赞】
【18评论】【48点赞】
【94评论】【62点赞】
【216评论】【124点赞】
【2评论】【16点赞】
作者最新文章
热门分类
科技TOP
科技最新文章