← 返回
未分类

文档能听

将电脑里的Word、PDF、TXT等文档转换为MP3语音文件,让用户可以听文档内容,缓解视觉疲劳。支持批量转换、语音选择、语速调节。当用户需要听文档、将文章转为音频、批量转换文档为声音文件时启用。
天线同学
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 143
下载
💾 5
安装
1
版本
#latest

概述

文档转语音 (Doc to Speech)

将Word、PDF、TXT等文档转换为MP3音频文件,让用户可以"听"文档内容,缓解视觉疲劳。

功能特性

  • 多格式支持: Word (.docx)、PDF (.pdf)、TXT (.txt)、Markdown (.md) 等
  • 批量转换: 支持同时转换多个文件或整个文件夹
  • 语音选择: 可选择不同的语音和语速
  • 离线/在线: 支持离线TTS (pyttsx3) 和在线TTS (Google TTS)
  • 中文支持: 完整支持中文文档朗读

使用场景

  • 长时间阅读导致眼睛疲劳,想听文档内容
  • 通勤路上想"听"文章或报告
  • 需要批量将文档转为有声书
  • 视力不便的用户需要语音辅助阅读

快速开始

1. 安装依赖

首次使用前,安装必要的依赖库:

python scripts/install_dependencies.py

或手动安装:

pip install docx2txt pdfplumber PyPDF2 pyttsx3 gtts

2. 转换单个文件

# 基本用法
python scripts/doc_to_speech.py 文档.docx

# 指定输出路径
python scripts/doc_to_speech.py 文档.docx -o 输出.mp3

# 调整语速
python scripts/doc_to_speech.py 文档.pdf -r 120

# 使用Google TTS(在线,质量更好)
python scripts/doc_to_speech.py 文档.txt -e gtts

3. 批量转换

# 转换多个文件
python scripts/doc_to_speech.py 文件1.docx 文件2.pdf 文件3.txt

# 转换整个文件夹
python scripts/doc_to_speech.py ./文档文件夹/ -o ./输出音频/

4. 查看可用语音

python scripts/doc_to_speech.py --list-voices

参数说明

参数说明示例
------------------
input输入文件或文件夹路径文档.docx
-o, --output输出路径-o 音频.mp3
-e, --engineTTS引擎 (pyttsx3gtts)-e pyttsx3
-v, --voice语音ID-v 0
-r, --rate语速 (默认150)-r 120
-l, --lang语言代码 (gtts用)-l zh-cn
--list-voices列出可用语音--list-voices

工作流程

当用户需要将文档转为语音时:

  1. 确认需求: 了解用户要转换的文件、输出要求
  2. 检查依赖: 确保必要库已安装
  3. 执行转换: 运行转换脚本
  4. 验证结果: 确认MP3文件生成成功

技术说明

支持的文档格式

  • Word (.docx): 使用 docx2txt 提取文本
  • PDF (.pdf): 使用 pdfplumberPyPDF2 提取文本
  • 文本 (.txt, .md): 直接读取,自动检测编码

TTS引擎对比

引擎类型优点缺点
------------------------
pyttsx3离线无需网络,响应快,免费语音质量一般
gTTS在线语音质量高,自然流畅需要网络,有请求限制

注意事项

  • 长文档会自动分段处理
  • PDF扫描件(图片)无法直接转换,需要先OCR
  • 部分PDF格式复杂可能提取文本不完整
  • Windows系统建议安装中文语音包以获得更好效果

示例

示例1:转换Word文档

python scripts/doc_to_speech.py 报告.docx -o 报告音频.mp3 -r 130

示例2:批量转换文件夹

python scripts/doc_to_speech.py ./我的文档/ -o ./有声书/ -e gtts

示例3:Python代码调用

from scripts.doc_to_speech import convert_file

# 转换单个文件
convert_file(
    input_path="文章.pdf",
    output_path="文章.mp3",
    engine="pyttsx3",
    rate=140
)

故障排除

问题:无法提取PDF文本

解决: 安装pdfplumber

pip install pdfplumber

问题:中文朗读效果差

解决:

  1. Windows用户安装Microsoft Speech Platform
  2. 或使用在线引擎: -e gtts

问题:转换速度慢

解决:

  • 使用离线引擎 pyttsx3 代替 gtts
  • 减少单次转换的文本量

问题:语音断断续续

解决: 调整语速参数 -r,建议范围 120-180

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-04-04 22:23 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

office-efficiency

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 399 📥 149,494
professional

商业模式研究报告

user_aad6add3
基于SKILL框架的商业模式分析工具,帮助用户系统性地研究和构建商业模式。整合商业模式画布9大板块、逻辑四维与深化三维研究视角、产业链定位、文化主张与认知解决四大模块。适用于商业分析、BP撰写、战略规划、投资决策等场景。输出成果为Word文
★ 6 📥 1,237
office-efficiency

Word / DOCX

ivangdavila
创建、检查和编辑 Microsoft Word 文档及 DOCX 文件,支持样式、编号、修订记录、表格、分节符及兼容性检查等功能。
★ 475 📥 157,279