← 返回
未分类

免费PDF文件翻译-保留原格式

Translate PDF scientific papers with bilingual comparison output while preserving formulas, charts, tables of contents, and annotations. Based on pdf2zh-next (BabelDOC). Triggered when the user needs to translate PDF documents (especially English-Chinese), generate bilingual comparison PDFs, translate specific pages, or batch-process multiple PDFs. Supports Google, DeepL, OpenAI, DeepSeek, SiliconFlow and other translation backends.
Translate PDF scientific papers with bilingual comparison output while preserving formulas, charts, tables of contents, and annotations. Based on pdf2zh-next (BabelDOC). Triggered when the user needs to translate PDF documents (especially English-Chinese), generate bilingual comparison PDFs, translate specific pages, or batch-process multiple PDFs. Supports Google, DeepL, OpenAI, DeepSeek, SiliconFlow and other translation backends.
鲲鹏Talk
未分类 community v1.0.0 1 版本 100000 Key: 无需
★ 2
Stars
📥 245
下载
💾 0
安装
1
版本
#latest

概述

PDF 论文翻译 (pdf2zh-next)

将 PDF 文档(尤其是学术论文)翻译为中文,保留公式、图表、目录和注释。默认输出双语对照 + 纯译文两个文件。

快速开始

pdf2zh_next input.pdf --lang-out zh-CN

首次运行会下载模型资源(约 500MB,含 CMap 字体映射和 DocLayout-YOLO 模型),之后即用即翻。

安装

推荐通过 uv 安装(macOS 首选):

pip install uv
uv tool install --python 3.12 pdf2zh-next

安装后二进制路径通常在:

  • macOS: ~/Library/Application Support/uv/tools/pdf2zh-next/bin/pdf2zh_next
  • Linux: ~/.local/bin/pdf2zh_next

如果终端找不到命令,用完整路径调用即可。

运行 pdf2zh_next --version 确认安装成功。

常用翻译场景

英文论文 → 中文(最常用)

pdf2zh_next paper.pdf --lang-in en --lang-out zh-CN

中→英

pdf2zh_next paper.pdf --lang-in zh-CN --lang-out en

指定翻译页面

pdf2zh_next paper.pdf --pages 1-5,7,10-12 --lang-out zh-CN

只输出纯译文(不要双语对照)

pdf2zh_next paper.pdf --no-dual --lang-out zh-CN

指定输出目录

pdf2zh_next paper.pdf --output /path/to/dir --lang-out zh-CN

批量翻译

pdf2zh_next file1.pdf file2.pdf file3.pdf --lang-out zh-CN

翻译服务选择

默认使用 SiliconFlow 免费引擎(无需 API key)。若免费引擎质量不足或需要更快速度,可切换:

# Google 翻译(免费,需网络)
pdf2zh_next paper.pdf --google --lang-out zh-CN

# DeepL(需配置 API key)
pdf2zh_next paper.pdf --deepl --lang-out zh-CN

# OpenAI / DeepSeek(需配置 API key,质量最好)
pdf2zh_next paper.pdf --openai --lang-out zh-CN
pdf2zh_next paper.pdf --deepseek --lang-out zh-CN

核心参数速查

参数说明
------------
--lang-in 源语言,省略则自动检测
--lang-out 目标语言,中译用 zh-CN
--pages 页码范围,如 1-5,7,10-12
--output 指定输出目录
--no-dual不生成双语对照文件
--no-mono不生成纯译文文件
--dual-translate-first双语模式下译文页在前
--qps 翻译速率限制(默认不限)
--debug输出详细调试信息
--gui启动 Web UI 而非命令行

常用语言代码

语言代码
------------
简体中文zh-CN
繁体中文zh-TW
英语en
日语ja
韩语ko
法语fr
德语de
西班牙语es
俄语ru
阿拉伯语ar

输出文件

翻译完成后在当前(或指定)目录生成:

  • xxx.zh-CN.mono.pdf — 纯中文译文
  • xxx.zh-CN.dual.pdf — 中英双语对照(推荐阅读用)
  • xxx.zh-CN.glossary.csv — 自动提取的术语表

推荐使用 dual.pdf,可以同时对照原文和译文看。

故障排查

WARNING 类信息一般不影响翻译结果Expecting ',' delimiterExpecting property name 等警告来自免费翻译引擎的 JSON 解析问题,工具会自动 fallback 重试,只要最终显示 "Translation completed" 即为成功。

翻译质量不佳:切换翻译服务,推荐 --openai--deepseek 获得更好的翻译质量。

内存不足:大文件翻译峰值内存可能超过 1.3GB,用 --pages 分批翻译。

命令找不到:用 uv 安装后二进制可能不在 PATH 中,使用完整路径调用。

辅助脚本

scripts/translate_pdf.sh — 一键翻译脚本:

# 默认英→中
bash scripts/translate_pdf.sh input.pdf

# 指定语言和页面
bash scripts/translate_pdf.sh input.pdf en 1-10 /output/dir

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-05-20 15:06 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

保险经纪人/代理人助手

user_e263a450
"保盾"是一款面向中国大陆保险市场的经纪人/代理人智能辅助系统。针对保险行业长期存在的"销售误导多、条款看不懂、理赔纠纷频发"三大痛点,"保盾"以专业提示词工程为基础,构建覆盖产品知识、合同审查、需求测评、产品对比、核保预判、理赔协助、合规
★ 2 📥 89

bilibili-channel-analyst

user_e263a450
Extract and analyze Bilibili channel video data to provide deep insights, traffic funnel analysis, and actionable optimi
★ 0 📥 143

x-scrapy

user_e263a450
XScrapy是一款AI驱动的通用爬虫引擎,能够零配置地从任意URL自动识别页面类型(如电商、新闻、社交、论坛、文档等),并提取标题、正文、价格、评论、图片等结构化数据,以标准化JSON格式输出;它内置反检测机制、代理轮换、分页处理与去重功
★ 3 📥 464