← 返回
未分类 Key 中文

Ppt Ocr

OCR for PowerPoint (.ppt, .pptx) presentations with scanned or image-embedded slides. Uses MinerU to extract text from image-based presentation content. Feat...
OCR for PowerPoint (.ppt, .pptx) presentations with scanned or image-embedded slides. Uses MinerU to extract text from image-based presentation content. Feat...
mzlzyca mzlzyca 来源
未分类 clawhub v0.4.0 1 版本 100000 Key: 需要
★ 0
Stars
📥 421
下载
💾 0
安装
1
版本
#latest

概述

Ppt Ocr

Convert and extract content from .ppt using MinerU (mineru-open-api).

Install

npm install -g mineru-open-api
# or via Go (macOS/Linux):
go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

Quick Start

# OCR extraction (requires token)
mineru-open-api extract slides.ppt --ocr -o ./out/

# From URL
mineru-open-api extract https://example.com/slides.ppt --ocr -o ./out/

Authentication

Token required for extract and crawl:

mineru-open-api auth            # Interactive token setup
export MINERU_TOKEN="your-token" # Or via environment variable

Create token at: https://mineru.net/apiManage/token

Capabilities

  • Supports local files and URLs
  • Requires token (mineru-open-api auth or MINERU_TOKEN env)
  • Supported input: .ppt
  • Language hint with --language (default: ch, use en for English)
  • Page range with --pages (where applicable)

Notes

  • .ppt requires extract with token. Add --ocr for image-heavy slides.
  • Output goes to stdout by default; use -o to save to file
  • Binary formats (docx) require -o flag (cannot stream to stdout)
  • All progress/status messages go to stderr
  • MinerU is an open-source project by OpenDataLab (Shanghai AI Lab): https://github.com/opendatalab/MinerU

版本历史

共 1 个版本

  • v0.4.0 当前
    2026-05-03 07:49 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

office-efficiency

Gog

steipete
Google Workspace 命令行工具,支持 Gmail、日历、云端硬盘、通讯录、表格和文档。
★ 932 📥 187,371
office-efficiency

Excel / XLSX

ivangdavila
创建、检查和编辑 Microsoft Excel 工作簿及 XLSX 文件,支持可靠的公式、日期、类型、格式、重算及模板保留功能。
★ 388 📥 147,646
dev-programming

PDF to LaTeX

mzlzyca
使用 MinerU 将 PDF 文档转换为 LaTeX 源码,提取文本、公式和结构,输出 LaTeX 格式,适用于学术和技术文档。
★ 0 📥 625