将 PDF 文档(尤其是学术论文)翻译为中文,保留公式、图表、目录和注释。默认输出双语对照 + 纯译文两个文件。
pdf2zh_next input.pdf --lang-out zh-CN
首次运行会下载模型资源(约 500MB,含 CMap 字体映射和 DocLayout-YOLO 模型),之后即用即翻。
推荐通过 uv 安装(macOS 首选):
pip install uv
uv tool install --python 3.12 pdf2zh-next
安装后二进制路径通常在:
~/Library/Application Support/uv/tools/pdf2zh-next/bin/pdf2zh_next~/.local/bin/pdf2zh_next如果终端找不到命令,用完整路径调用即可。
运行 pdf2zh_next --version 确认安装成功。
pdf2zh_next paper.pdf --lang-in en --lang-out zh-CN
pdf2zh_next paper.pdf --lang-in zh-CN --lang-out en
pdf2zh_next paper.pdf --pages 1-5,7,10-12 --lang-out zh-CN
pdf2zh_next paper.pdf --no-dual --lang-out zh-CN
pdf2zh_next paper.pdf --output /path/to/dir --lang-out zh-CN
pdf2zh_next file1.pdf file2.pdf file3.pdf --lang-out zh-CN
默认使用 SiliconFlow 免费引擎(无需 API key)。若免费引擎质量不足或需要更快速度,可切换:
# Google 翻译(免费,需网络)
pdf2zh_next paper.pdf --google --lang-out zh-CN
# DeepL(需配置 API key)
pdf2zh_next paper.pdf --deepl --lang-out zh-CN
# OpenAI / DeepSeek(需配置 API key,质量最好)
pdf2zh_next paper.pdf --openai --lang-out zh-CN
pdf2zh_next paper.pdf --deepseek --lang-out zh-CN
| 参数 | 说明 |
|---|---|
| ------ | ------ |
--lang-in | 源语言,省略则自动检测 |
--lang-out | 目标语言,中译用 zh-CN |
--pages | 页码范围,如 1-5,7,10-12 |
--output | 指定输出目录 |
--no-dual | 不生成双语对照文件 |
--no-mono | 不生成纯译文文件 |
--dual-translate-first | 双语模式下译文页在前 |
--qps | 翻译速率限制(默认不限) |
--debug | 输出详细调试信息 |
--gui | 启动 Web UI 而非命令行 |
| 语言 | 代码 |
|---|---|
| ------ | ------ |
| 简体中文 | zh-CN |
| 繁体中文 | zh-TW |
| 英语 | en |
| 日语 | ja |
| 韩语 | ko |
| 法语 | fr |
| 德语 | de |
| 西班牙语 | es |
| 俄语 | ru |
| 阿拉伯语 | ar |
翻译完成后在当前(或指定)目录生成:
xxx.zh-CN.mono.pdf — 纯中文译文xxx.zh-CN.dual.pdf — 中英双语对照(推荐阅读用)xxx.zh-CN.glossary.csv — 自动提取的术语表推荐使用 dual.pdf,可以同时对照原文和译文看。
WARNING 类信息一般不影响翻译结果:Expecting ',' delimiter 和 Expecting property name 等警告来自免费翻译引擎的 JSON 解析问题,工具会自动 fallback 重试,只要最终显示 "Translation completed" 即为成功。
翻译质量不佳:切换翻译服务,推荐 --openai 或 --deepseek 获得更好的翻译质量。
内存不足:大文件翻译峰值内存可能超过 1.3GB,用 --pages 分批翻译。
命令找不到:用 uv 安装后二进制可能不在 PATH 中,使用完整路径调用。
scripts/translate_pdf.sh — 一键翻译脚本:
# 默认英→中
bash scripts/translate_pdf.sh input.pdf
# 指定语言和页面
bash scripts/translate_pdf.sh input.pdf en 1-10 /output/dir
共 1 个版本