OFD(Open Fixed-layout Document)文档读取和转换工具。从 OFD 文件中提取内容并转换为 Markdown。
python scripts/ofd_to_text.py <ofd文件路径>
输出到文件:
python scripts/ofd_to_text.py <ofd文件路径> output.txt
python scripts/ofd_to_markdown.py <ofd文件路径>
输出到文件:
python scripts/ofd_to_markdown.py <ofd文件路径> output.md
scripts/ofd_to_text.py:提取纯文本,保留所有文字内容但不处理格式scripts/ofd_to_markdown.py:转换为 Markdown,保留段落、标题和表格结构scripts/install_dependencies.py:安装可选依赖(核心功能使用标准库)OFD 文件结构:
OFD.xml(文档清单)Doc_0/ 目录包含文档内容http://www.ofdspec.org/2016 命名空间关键元素:
TextCode:文本内容Paragraph:段落Table:表格Row/Cell:表格行和单元格提取 OFD 文档文本:
# 用户询问时
python "C:\Users\zhan\.claude\plugins\skills\OfdReader\scripts\ofd_to_text.py" "document.ofd" "extracted.txt"
转换为 Markdown:
python "C:\Users\zhan\.claude\plugins\skills\OfdReader\scripts\ofd_to_markdown.py" "document.ofd" "document.md"
错误:"文件不是有效的 OFD (ZIP) 格式"
错误:"OFD 文件不存在"
提取内容为空
表格格式混乱
共 1 个版本