🌐 中英互译技能
文档级中英互译,支持加载术语文档确保术语一致性,逐页翻译,输出 DOCX。
何时使用
- 用户提供中文章档,要求翻译成英文
- 用户提供英文文档,要求翻译成中文
- 用户提到"翻译文档"、"翻译"、"中英互译"
使用限制
- 源文档支持格式:PDF、DOCX、TXT、PPTX
- 术语文档支持格式:Excel(.xlsx/.xls)、CSV、TXT(每行一个术语,格式:
中文 | 英文 或 中文,英文) - 输出格式:DOCX
使用方法
第一步:加载文件
用户需提供:
- 术语文档(可选,推荐提供):包含专业术语对照,格式支持 Excel/CSV/TXT
- 待翻译文档:PDF、DOCX、TXT 或 PPTX
第二步:确认翻译方向
自动检测源文档语言,确认翻译方向:
- 中文 → 英文:所有中文内容翻译为英文
- 英文 → 中文:所有英文内容翻译为中文
如有术语冲突,以加载的术语文档为准。
第三步:逐页翻译
按文档结构逐页/逐段落翻译,保持:
- 原文格式(标题层级、列表、表格结构)
- 术语一致性(使用术语文典中的对照)
- 段落完整性(不随意拆分段落的连贯句子)
第四步:输出 DOCX
翻译完成后,生成 DOCX 文档保存至工作目录。
翻译流程详解
术语加载
- 读取术语文档(Excel/CSV/TXT)
- 解析术语对,存入术语表
- 翻译时优先使用术语表中的对照
术语文档格式示例:
中文术语,英文术语
人工智能,Artificial Intelligence
机器学习,Machine Learning
语言检测
读取源文档前 500 字,判断:
- 中文字符占比 > 30% → 源语言为中文
- 否则判定为英文
分页翻译
使用 read 工具按 offset/limit 分批读取文档内容,每次处理约 2000 字,
翻译后追加到输出缓冲区,最后统一生成 DOCX。
DOCX 生成
使用 minimax-docx 技能将翻译内容写入 DOCX:
- 保留原文的标题层级结构(一级/二级/三级标题)
- 保留段落分隔
- 保留列表和表格的基本格式
示例对话
用户: 帮我翻译这个文档
Bot: 请提供:① 术语文档(如有)② 待翻译的文档
用户上传了术语表 + 英文文档
Bot: 检测到源语言为英文,翻译方向:EN → ZH ✓。开始逐页翻译中...
Bot: 翻译完成!已保存至:translation_output.docx
输出文件
- 文件名格式:
{原文件名}_翻译.docx - 保存位置:工作目录(C:\Users\Administrator\lobsterai\project\plain-english-movement\docs)
注意事项
- 术语表中已有术语以术语表为准,不做重复翻译
- 翻译引擎对专业术语、学术词汇的翻译可能需人工校对
- 复杂表格(合并单元格)可能无法完美还原
- PDF 中的图片内文字无法翻译,仅翻译可读取文本
目录结构
bilingual-translate/
├── SKILL.md
└── references/
└── format-guide.md ← 术语文档格式说明