← 返回
未分类

funasr-punctuation-restore

当用户想要**给文本恢复标点**、**ASR 转录结果加标点**、**无标点文本加标点**、**转录文本整理标点**、**批量给文件或目录加标点**时自动触发。 使用 FunASR ct-punc 模型,为一段文本、单个记事本文件(.txt)、或整个目录一键恢复中文/英文标点符号。 支持直接输入文本、单个文件路径...
当用户需要对文本、ASR 转录结果或无标点文本添加标点,或批量处理文件/目录时自动触发。使用 FunASR ct-punc 模型,可为单段文本、单个 .txt 文件或整个目录一键恢复中文/英文标点。支持直接输入文本或文件路径。
wangminrui2022
未分类 clawhub v1.0.6 2 版本 100000 Key: 无需
★ 0
Stars
📥 543
下载
💾 3
安装
2
版本
#latest

概述

Funasr-Punctuation-Restore

功能:使用 FunASR ct-punc 模型一键恢复标点(支持文本/文件/目录)。目录模式会在同级创建结构完全一致的 _punctuated 镜像目录(原目录不变)。支持 GPU 加速 + 自动清理显存。

触发时机(Triggers)

  • 用户提供一段没有标点或标点不全的文本,要求“加标点”“恢复标点”“整理标点”。
  • 用户提供 .txt 文件路径或整个文件夹,要求批量处理。
  • 常用于 ASR(语音转文字)后的后处理场景。
  • 支持直接粘贴文本、单个文件、或整个目录。

支持的模型(推荐顺序)

  1. punc_ct-transformer_cn-en-common-vocab471067-large → 基于 Transformer 的中英文混合文本标点恢复模型,适合 ASR 结果自动加标点。

参数提取指南

当决定调用此技能时,请从用户上下文中提取以下参数:

  1. --text "<文本内容>" (如果用户直接提供了文本)
  2. --file "<文件路径>" (如果用户提供了单个 .txt 文件路径)
  3. --dir "<目录路径>" (如果用户提供了文件夹路径,会批量处理)

执行步骤

  1. 解析输入:识别用户是提供了文本、单个文件,还是整个目录。
  2. 默认目标:若未指定输出路径,默认在输入同级创建 [原文件名]_punctuated.txt_punctuated 目录(原文件/目录保持不变)。
  3. 调用命令:使用以下兼容性命令启动脚本(优先 python3,失败则 python)。脚本会自动创建虚拟环境、检测 GPU 并安装对应版本。

```bash

(python3 scripts/punctuation_restore.py (--text "<文本内容>" | --file "<文件路径>" | --dir "<目录路径>")) || (python scripts/punctuation_restore.py (--text "<文本内容>" | --file "<文件路径>" | --dir "<目录路径>"))

版本历史

共 2 个版本

  • v1.0.6 当前
    2026-05-03 05:04 安全 安全
  • v1.0.0
    2026-03-31 04:21

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

turbo-whisper-local-stt

wangminrui2022
当用户需要音频转文字、语音转文本、转录录音、生成字幕、会议录音整理、语音笔记转写、本地音频转录时触发。采用本地 Faster-Whisper(large-v3-ct2 等模型),高性能、中文优先,完全离线运行,保护隐私,支持 wav、mp3
★ 0 📥 559

mp4-to-mp3-extractor

wangminrui2022
批量将指定目录下的 .mp4 视频提取音频转为 .mp3,支持自定义源目录和输出目录,未指定输出时自动在源目录后加 _audio,自动管理 Python 虚拟环境,保持层级结构,兼容 python3 与 python。
★ 0 📥 622

melo-tts-metadata-creator

wangminrui2022
在用户需要为MeloTTS 训练或微调生成 metadata.list 时自动触发,专注处理 .wav 音频及对应 .txt 转录,自动生成符合最新官方标准的 metadata.list(格式:音频路径|speaker|语言|文本),支持单
★ 0 📥 559