← 返回
未分类

Audio Processor

音频处理工具集 - 支持音频录制、剪辑、格式转换、频谱分析、降噪、变速变调等操作。Use when: (1) 需要处理音频文件(录音、剪辑、合并、分割), (2) 需要转换音频格式(MP3/WAV/FLAC/OGG等), (3) 需要分析音频特征(频谱、音量、静音检测), (4) 需要对音频进行效果处理(降噪、变...
音频处理工具集 - 支持音频录制、剪辑、格式转换、频谱分析、降噪、变速变调等操作。Use when: (1) 需要处理音频文件(录音、剪辑、合并、分割), (2) 需要转换音频格式(MP3/WAV/FLAC/OGG等), (3) 需要分析音频特征(频谱、音量、静音检测), (4) 需要对音频进行效果处理(降噪、变...
kaiyuelv kaiyuelv 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 334
下载
💾 0
安装
1
版本
#latest

概述

Audio Processor

音频处理全能工具集,基于 Python + ffmpeg + librosa/pydub 实现。

核心能力

1. 音频格式转换

  • 支持 MP3 / WAV / FLAC / OGG / AAC / M4A 互转
  • 批量转换目录内音频
  • 自定义比特率、采样率、声道数

2. 音频剪辑与合并

  • 按时间码裁剪(hh:mm:ss 格式)
  • 去除首尾静音段
  • 多段音频合并拼接
  • 淡入淡出效果

3. 音频分析

  • 波形可视化(matplotlib)
  • 频谱分析(FFT + spectrogram)
  • 音量检测(RMS / dBFS)
  • BPM / 节奏检测
  • 静音段检测与分割

4. 音频效果处理

  • 降噪(spectral gating)
  • 变速不变调 / 变调不变速
  • 音量标准化(peak / RMS / LUFS)
  • 混响、延迟效果

5. 音频信息提取

  • 时长、采样率、比特率、声道数
  • ID3 标签 / 元数据读写
  • 音频指纹生成

快速开始

# 格式转换
python3 scripts/convert_format.py input.wav output.mp3 --bitrate 320k

# 剪辑音频(从30秒到2分钟)
python3 scripts/cut_audio.py input.mp3 output.mp3 --start 00:00:30 --end 00:02:00

# 分析音频特征
python3 scripts/analyze_audio.py input.mp3 --output report.json

# 降噪处理
python3 scripts/denoise.py input.mp3 output.mp3

# 批量处理目录
python3 scripts/batch_process.py ./audio_dir/ --action convert --format mp3

依赖安装

pip install -r requirements.txt

核心依赖:ffmpeg(系统级)、pydub、librosa、soundfile、mutagen、numpy、matplotlib、noisereduce

脚本说明

脚本功能
------------
convert_format.py格式转换,支持所有主流格式
cut_audio.py按时间码裁剪音频
merge_audio.py多文件合并拼接
analyze_audio.py音频特征分析(波形/频谱/BPM)
denoise.py降噪处理
speed_pitch.py变速变调
normalize_volume.py音量标准化
batch_process.py批量处理目录
extract_metadata.py元数据提取与编辑
detect_silence.py静音检测与自动分割

详细用法

参见 references/ 目录:

  • audio-formats.md - 支持的音频格式详解
  • effects-guide.md - 效果处理参数指南
  • api-reference.md - 脚本 API 参考

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 22:01 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 330 📥 93,719
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 429 📥 116,862
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 217 📥 47,467