← 返回
未分类

lego moc图纸零件表提取

从 LEGO/MOC 说明书 PDF 提取零件清单并生成 Excel 文件。触发场景:(1) 用户要求从 PDF 提取 LEGO 零件表 (2) 批量处理多个套装的零件清单 (3) 生成符合模板格式的零件选件表 (4) 提到"零件表"、"零件清单"、"选件表"、"MOC"等关键词。支持图片型 PDF(通过视觉识别)和文本型 PDF。
从 LEGO/MOC 说明书 PDF 提取零件清单,同时映射成高砖颜色标号并生成 Excel 文件。触发场景:(1) 用户要求从 PDF 提取 LEGO 零件表 (2) 批量处理多个套装的零件清单 (3) 生成符合模板格式的零件选件表 (4) 提到"零件表"、"零件清单"、"选件表"、"MOC"等关键词。支持图片型 PDF(通过视觉识别)和文本型 PDF。
user_a6cb5100
未分类 community v1.0.0 1 版本 98437.5 Key: 无需
★ 0
Stars
📥 63
下载
💾 0
安装
1
版本
#latest

概述

LEGO Parts Extractor

从 LEGO 说明书 PDF 中提取零件清单,生成符合模板格式的 Excel 文件。

工作流程

1. 确认输入文件

  • PDF 文件位置(单个或批量)
  • 模板 Excel 文件(用于颜色代码映射)
  • 输出目录

2. 提取 PDF 图片

LEGO 说明书通常是图片型 PDF,需要先提取内嵌图片:

import fitz  # pymupdf

doc = fitz.open(pdf_path)
for page_num in range(len(doc)):
    page = doc[page_num]
    pix = page.get_pixmap(dpi=150)
    pix.save(f"page_{page_num+1}.png")

3. 定位零件表页面

关键规则:零件表通常在特定页面,其他页面是拼搭步骤

  • 先询问用户零件表在哪几页(如 "只有第3页是零件表")
  • 常见模式:Page 2-3 或仅 Page 3
  • 拼搭步骤页面(Step 1, 2, 3...)不是完整零件清单

4. 视觉提取零件数据

从零件表图片中识别:

  • 零件编号:如 3024, 3005, 4073 等
  • 颜色名称:如 Black, White, Dark Bluish Gray 等
  • 数量:每个零件的数量

5. 颜色代码映射

从模板 Excel 的 Sheet2 获取颜色代码:

  • D列 = 颜色编号
  • E列 = Stud.io 颜色名称

常见颜色映射(参考 references/color_codes.md):

  • Black = 026
  • White = 001
  • Dark Bluish Gray = 199
  • Light Bluish Gray = 194
  • Reddish Brown = 192

6. 生成 Excel 文件

输出格式(四列):

零件编号颜色编号数量原始颜色名称

使用 scripts/generate_excel.py 批量生成。

批量处理模式

当有多个套装时:

  1. 将所有 PDF 放在同一目录
  2. 使用 scripts/batch_extract.py 批量提取图片
  3. 逐个套装提取零件数据
  4. 使用 scripts/generate_excel.py 批量生成 Excel

关键注意事项

PDF 访问问题

  • 文件名含 & 等特殊字符时,Python/PowerShell 可能无法直接访问
  • 解决方案:使用 glob 匹配或复制到临时路径

Excel 文件锁定

  • Windows 下 Excel 文件可能被 WPS/Edge 锁定
  • 解决方案:生成到临时文件名,然后用 -Force 覆盖

颜色代码缺失

  • 模板中可能缺少某些颜色
  • 查阅 Stud.io 标准编号手动补充
  • 参考 references/color_codes.md

编码问题

  • Windows 下使用 openpyxl 而非 pandas(pandas 有中文编码问题)
  • PowerShell 不支持 &&,用 ; 或分开执行

Resources

scripts/

  • generate_excel.py - 批量生成 Excel 文件的主脚本
  • extract_images.py - 从 PDF 提取图片

references/

  • color_codes.md - LEGO 颜色代码映射参考

assets/

  • template.xlsx - Excel 模板文件(可选,用户可指定自己的模板)

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-05-18 16:23 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

developer-tools

Github

steipete
使用 `gh` CLI 与 GitHub 交互,通过 `gh issue`、`gh pr`、`gh run` 和 `gh api` 管理议题、PR、CI 运行及高级查询。
★ 668 📥 324,060
ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,356 📥 318,138
security-compliance

Skill Vetter

spclaudehome
AI智能体技能安全预审工具。安装ClawdHub、GitHub等来源技能前,检查风险信号、权限范围及可疑模式。
★ 1,215 📥 266,448