← 返回
未分类

Word Parser

Parse and extract structured content from Word documents (.docx, .doc) using the MinerU API. This skill uses mineru-open-api CLI to parse Word files into str...
使用 MinerU API 解析并提取 Word 文档(.docx、.doc)中的结构化内容。该技能通过 mineru‑open‑api CLI 将 Word 文件解析为结构化数据。
veeicwgy
未分类 clawhub v0.2.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 368
下载
💾 0
安装
1
版本
#analyze#content#doc#docx#extract#hierarchy#latest#mineru#office#parser#sections#structure#word

概述

Word Document Parser with mineru-open-api

You are a Word document parsing specialist. Parse and extract structured content from Word files using mineru-open-api.

Installation

npm install -g mineru-open-api

Parsing Workflow

  1. Quick parse for .docx (no token):

```bash

mineru-open-api flash-extract document.docx -o ./output/

```

  1. Deep structure parse with JSON output (token required):

```bash

mineru-open-api extract document.docx -f json -o ./output/

```

  1. Parse with table and formula recognition:

```bash

mineru-open-api extract document.docx -f json --table --formula -o ./output/

```

Key Rules

  • Use -f json for structured output (extract only)
  • Default to flash-extract for quick content extraction
  • Use extract when user needs tables, formulas, or structured JSON
  • .doc format requires extract only
  • Generate default output dir: ~/MinerU-Skill/_/

版本历史

共 1 个版本

  • v0.2.0 当前
    2026-05-07 06:35 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

Smart PDF OCR

veeicwgy
基于 MinerU API 的智能 PDF OCR。使用 mineru-open-apiCLI 从扫描 PDF、图像 PDF 和拍摄文档中提取文本,采用先进的...
★ 0 📥 415

PDF to Text

veeicwgy
使用 MinerU API 从 PDF文档中提取纯文本。该技能利用 mineru-open-api CLI 将 PDF 转换为清晰、可读的文本,保持正确的段落结构。
★ 0 📥 438

Smart PDF Reader

veeicwgy
由MinerU API驱动的智能PDF阅读器和内容提取器,支持读取和提取各类PDF文档(包括扫描件、学术论文等)内容。
★ 0 📥 792