功能:本地音频增强与修复统一工具,集成 VoiceFixer(语音降噪/修复)和 AudioSR(高保真超级分辨率)。支持单文件与目录批量处理,自动适配最合适的增强模式,输出清晰、高质量的 48kHz WAV 文件。
--hifi 时)
当决定调用此技能时,请从用户消息中准确提取以下参数:
<输入路径> (必填): 用户提供的音频文件路径或文件夹路径(支持相对/绝对路径)。
<输出路径> (选填): 用户指定的输出文件或目录路径。若未指定,默认在输入同级目录自动添加 _enhanced 后缀。
<模式选择> (选填):
--hifi 并使用 AudioSR。
--mode:0/1/2(推荐 1,默认 1)
--cuda:是否使用 GPU
-r, --recursive:是否递归子目录
--hifi 模式):
--model_name:basic 或 speech(人声推荐 speech)
--ddim_steps:扩散步数(默认 50,建议 50-100)
--guidance_scale:引导尺度(默认 3.5)
--seed:随机种子(默认 42)
--device:cuda 或 cpu
--hifi)。
_enhanced_48k(AudioSR)或 _enhanced(VoiceFixer)后缀的文件。
python3,失败则 python)。脚本会自动检查环境、初始化模型并处理。
```bash
(python3 scripts/enhancer.py -i "<输入路径>" [-o "<输出目录>"] [-m <0|1|2>] [--cuda] [-r] [--hifi] [--model_name
共 1 个版本