← 返回
内容创作 中文

Smart Speak Multilingual TTS (Jaskies)

Chuyển đổi văn bản đa ngôn ngữ (Việt - Hoa - Anh) thành giọng nói chuẩn xác. Tự động xử lý Pinyin và ghép nối âm thanh chất lượng cao. Yêu cầu cài đặt edge-t...
多语言文本(越/中/英)转精准语音,自动处理拼音并拼接高质量音频。需安装edge-t...
jaskies
内容创作 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 521
下载
💾 6
安装
1
版本
#latest

概述

Smart-Speak: Trợ lý Giọng nói Đa ngôn ngữ

Skill này giúp em tạo ra các file âm thanh bài giảng hoặc thông báo chất lượng cao, kết hợp mượt mà giữa tiếng Việt, tiếng Hoa (bao gồm cả Pinyin) và tiếng Anh.

Yêu cầu hệ thống

Để skill này hoạt động hoàn hảo, máy của anh cần được trang bị các công cụ sau:

  1. Python 3: Nền tảng để chạy script xử lý.
  2. edge-tts: Thư viện cung cấp giọng đọc AI cực kỳ tự nhiên của Microsoft Edge.
  3. ffmpeg: Bộ công cụ mạnh mẽ để ghép nối các đoạn âm thanh.

Lệnh cài đặt nhanh (cho Linux/Ubuntu)

Anh chạy các dòng lệnh sau trong terminal để chuẩn bị nhé:

# Cài đặt ffmpeg
sudo apt update && sudo apt install -y ffmpeg

# Cài đặt edge-tts
python3 -m pip install edge-tts

Tính năng nổi bật

  1. Xử lý Pinyin thông minh: Tự động nhận diện và chuyển đổi Pinyin sang Hán tự trước khi đọc để đảm bảo thanh điệu chuẩn xác 100%.
  2. Phân đoạn ngôn ngữ: Tự động chia nhỏ văn bản thành các khối ngôn ngữ riêng biệt để áp dụng đúng giọng đọc bản ngữ.
  3. Giọng đọc ưu tiên:
    • 🇻🇳 Tiếng Việt: vi-VN-HoaiMyNeural (Dịu dàng, truyền cảm)
    • 🇨🇳 Tiếng Hoa: zh-CN-XiaoxiaoNeural (Chuẩn giọng Bắc Kinh)
    • 🇺🇸 Tiếng Anh: en-US-AvaNeural (Tự nhiên, hiện đại)

Quy trình thực hiện

  1. Phân tích: Tách câu thành các đoạn dựa trên ngôn ngữ.
  2. Chuyển đổi: Chuyển các đoạn Pinyin sang Hán tự (ví dụ: "Nǐ hǎo" -> "你好").
  3. Tổng hợp: Gọi smart_speak.py để tạo từng đoạn âm thanh nhỏ và dùng ffmpeg ghép lại thành một file .mp3 duy nhất.

Lệnh thực thi mẫu

python3 skills/public/smart-speak/scripts/smart_speak.py \
  --segments-json '[
    {"text": "Chào anh Vũ,", "voice": "vi-VN-HoaiMyNeural"},
    {"text": "你好吗?", "voice": "zh-CN-XiaoxiaoNeural"},
    {"text": "How are you today?", "voice": "en-US-AvaNeural"}
  ]' \
  --output "/home/jackie_chen_phong/.openclaw/workspace/bai_hoc.mp3"

Lưu ý quan trọng

  • Đường dẫn tuyệt đối: Luôn cung cấp đường dẫn đầy đủ cho file đầu ra (--output).
  • Xử lý Emoji: Skill sẽ tự động lược bỏ emoji để tránh máy đọc tên emoji làm gián đoạn bài học.
  • Dấu câu: Mỗi đoạn văn nên kết thúc bằng dấu câu phù hợp để tạo quãng nghỉ tự nhiên.

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-19 12:08 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Backup Full System

jaskies
完整备份OpenClaw系统(含数据库、配置与存储)并上传至云端。需安装rclone或对应上传工具。
★ 0 📥 687
content-creation

Baidu Wenku AIPPT

ide-rea
使用百度文库 AI 智能生成 PPT,自动根据内容选择模板。
★ 66 📥 46,202
content-creation

AdMapix

fly0pants
广告情报与应用数据分析助手,支持搜索广告素材、分析应用排名、下载量、收入及市场洞察,用于广告素材和竞品分析。
★ 295 📥 136,490