← 返回
未分类

audio-segmenter

当用户想要**把长音频切成小段**、**音频切片**、**音频分割**、**把音频分成固定时长片段**、**制作语音数据集**、**准备Karaoke素材**、**翻唱音频切片**时自动触发。 支持单个音频文件或整个文件夹(支持递归),自动用 ffmpeg 把音频按指定秒数切成小片段,完美保留原始文件夹结构,并智...
当用户需要将长音频切分为小段、音频切片或分割时自动触发。支持单文件或整个文件夹(递归),使用ffmpeg按指定时长切分,保留原始目录结构。
wangminrui2022 wangminrui2022 来源
未分类 clawhub v1.1.7 1 版本 100000 Key: 无需
★ 0
Stars
📥 507
下载
💾 0
安装
1
版本
#latest

概述

Audio-Segmenter

功能:一键把长音频切成固定时长的片段,专为语音训练、素材整理、翻唱/Karaoke 准备、数据集制作设计。完美保持原文件夹结构 + 智能默认输出路径 + 自动处理 ffmpeg。

触发时机(Triggers)

  • 用户提到“音频切片”“切成小段”“分割音频”“切片”“分段”“每段XX秒”等词,并提供音频文件路径或文件夹。
  • 用户说“帮我处理这个长音频”“制作语音数据集”“Karaoke素材准备”等场景。
  • 支持单个文件或整个文件夹(可递归)。

支持的音频格式

.mp3 / .wav / .m4a / .ogg / .flac / .aac / .wma 等(pydub 支持的所有常见格式)

参数说明(默认值)

  1. -i → 输入路径(必填,支持单个文件或文件夹)
  2. -d → 每段切片时长(秒),默认 60
  3. -o → 输出目录(不传则智能选择:单文件同目录,文件夹则在同级创建 [输入文件夹名]_sliced_audio)
  4. -r → 文件夹模式下是否递归子文件夹(默认否)

参数提取指南

当决定调用此技能时,请从用户上下文中提取以下参数:

  1. <输入路径> (必填): 用户提供的音频文件路径或文件夹路径。
  2. <切片秒数> (选填): 用户指定的每段时长(秒),未提则默认 60。
  3. <输出目录> (选填): 用户指定的输出路径,未指定则使用智能默认。
  4. 递归标志 (-r): 用户提到“递归”“所有子文件夹”时添加。

执行步骤

  1. 解析路径:自动识别用户的输入是单个音频文件还是文件夹。
  2. 默认输出:未指定 -o 时,单文件输出到源目录附近,文件夹则在同级创建带 _sliced_audio 的新文件夹,并保留原始目录结构。
  3. 调用命令:使用以下兼容性命令启动脚本(优先 python3,失败则 python)。脚本会自动创建虚拟环境、检测并安装 ffmpeg。

```bash

(python3 scripts/audio_slicer.py -i "<输入路径>" [-d <切片秒数>] [-o "<输出目录>"] [-r]) || (python scripts/audio_slicer.py -i "<输入路径>" [-d <切片秒数>] [-o "<输出目录>"] [-r])

版本历史

共 1 个版本

  • v1.1.7 当前
    2026-05-03 04:58 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 331 📥 93,751
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 429 📥 116,893
dev-programming

melo-tts-metadata-creator

wangminrui2022
在用户需要为MeloTTS 训练或微调生成 metadata.list 时自动触发,专注处理 .wav 音频及对应 .txt 转录,自动生成符合最新官方标准的 metadata.list(格式:音频路径|speaker|语言|文本),支持单
★ 0 📥 626