← 返回
未分类

Douyin Transcribe

全自动抖音视频下载 + 语音转文字管道。当用户发送抖音链接并要求转写文字、提取字幕、语音转文本时使用。触发词包括"抖音转写"、"抖音文字"、"抖音转文本"、"抖音字幕"、"douyin transcribe"。
全自动抖音视频下载及语音转文字管道。用于用户发送抖音链接并请求文字转写、字幕提取、语音转文本。触发词包括“抖音转写”、“抖音文字”、“抖音转文本”、“抖音字幕”、“douyin transcribe”。
mengzi53 mengzi53 来源
未分类 clawhub v1.0.1 1 版本 100000 Key: 无需
★ 0
Stars
📥 392
下载
💾 0
安装
1
版本
#latest

概述

Douyin Video Transcribe Skill

全自动抖音视频下载 + 语音转文字管道。

功能

输入抖音链接 → 自动解析直链 → 下载视频 → 提取音频 → 本地语音转文字 → 输出文稿

依赖安装(首次需要)

# 1. 安装 coli(语音转文字引擎)
npm install -g @marswave/coli

# 2. 安装 sensevoice 模型(首次自动下载,约60MB,需代理访问GitHub)
# 模型下载后保存在 ~/.coli/models/

# 3. ffmpeg(音频处理,系统已有)

# 4. Node.js(用于视频URL拦截脚本)

使用方法

基本用法(仅转写,不上传飞书)

python3 ~/.openclaw/skills/douyin-transcribe/scripts/transcribe.py \
  --url "https://v.douyin.com/xxxxx"

指定输出目录

python3 ~/.openclaw/skills/douyin-transcribe/scripts/transcribe.py \
  --url "https://v.douyin.com/xxxxx" \
  --output-dir /tmp/my_videos

完整用法(转写 + 上传飞书)

python3 ~/.openclaw/skills/douyin-transcribe/scripts/transcribe.py \
  --url "https://v.douyin.com/xxxxx" \
  --folder-token 飞书云盘文件夹token \
  --space-id 飞书知识库space_id

参数说明

参数说明
------------
--url, -u抖音视频链接(必填)
--output-dir, -o临时文件目录,默认 /tmp
--folder-token, -f飞书云盘文件夹 token
--space-id, -s飞书知识库 space ID
--no-feishu跳过飞书上传统步
--cleanup完成后删除本地临时文件(视频+音频)

输出

  • 终端打印完整转录文本
  • 本地保存 transcript.txt--output-dir
  • 视频/音频本地文件在 --output-dir(除非指定 --cleanup

技术流程

抖音链接
  └─→ Node.js (puppeteer-core + Chrome)
  │     └─→ 打开 hellotik.app
  │     └─→ 填入链接,点击解析
  │     └─→ 拦截网络请求,获取CDN直链
  └─→ curl 下载视频(直链)
  └─→ ffmpeg 提取音频(WAV 16kHz单声道)
  └─→ coli asr --model sensevoice(本地ASR,约1-3分钟)
  └─→ 输出转录文本 + 可选飞书上传统步

模型说明

  • sensevoice:阿里开源多语言ASR,支持中文/英文/日语/韩语/粤语,约60MB
  • 本地运行,无需API Key,完全离线
  • Intel Celeron J1900 上处理 1分钟音频约需 1-2 分钟

飞书上传说明

如需上传到飞书,需要在调用时传入 --folder-token--space-id

当前已配置:

  • 视频素材库 folder_token: RCIDfArx5lgZTIdO1SAcDU37n0e
  • 视频文案库 space_id: 7622229283829763274

常见问题

Q: 提示"无法获取视频直链"

A: CDN链接有时效(几分钟),多试几次即可。或 hellotik 解析失败,稍后重试。

Q: 转写时间太长

A: sensevoice 模型较大,处理速度依赖CPU。可改用 whisper-tiny 模型(更快但仅英文)。

Q: 视频很短/没有声音

A: 部分抖音视频是纯音乐或图片,语音转写会失败或输出很短。

版本历史

共 1 个版本

  • v1.0.1 当前
    2026-05-07 05:23 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 895 📥 205,241
content-creation

Marketing Skills

jchopard69
{"answer":"获取23个营销模块,包含CRO、SEO、文案、分析、发布、广告及社媒的清单、框架与现成交付物。"}
★ 143 📥 30,652
content-creation

humanizer-zh

liuxy951129-cpu
去除文本中的 AI 生成痕迹。适用于编辑或审阅文本,使其听起来更自然、更像人类书写。 基于维基百科的"AI 写作特征"综合指南。检测并修复以下模式:夸大的象征意义、 宣传性语言、以 -ing 结尾的肤浅分析、模糊的归因、破折号过度使用、三段
★ 58 📥 28,944