← 返回
内容创作 Key 中文

PDF OCR Using Gemini LLM

Extract text from PDFs using Google Gemini OCR. Use when extracting text from PDFs, performing OCR on scanned documents, or processing image-based PDFs.
使用 Google Gemini OCR 从 PDF 提取文本,适用于 PDF 文本提取、扫描文档 OCR 及图像型 PDF 处理。
ashtonizmev
内容创作 clawhub v0.1.7 1 版本 100000 Key: 需要
★ 0
Stars
📥 900
下载
💾 305
安装
1
版本
#latest

概述

Purpose

Use geminipdfocr to extract text from PDF documents via OCR (Google Gemini).

Data and privacy

Full page images/files are sent to Google's API. PDFs are split into single-page files and each page is uploaded to Google Gemini for OCR. There are no hidden exfiltration endpoints or other data collection. Do not use with highly sensitive documents unless you accept that content is sent to Google.

Setup (venv installation)

Before first use, create and activate the virtual environment:

cd geminipdfocr && python -m venv venv && source venv/bin/activate && pip install -r requirements.txt

Set GOOGLE_API_KEY in your environment before running (e.g. export GOOGLE_API_KEY=your-key).

How to use

When requested to extract text or perform OCR on a PDF:

  1. Run: cd geminipdfocr && source venv/bin/activate && python -m geminipdfocr [--json] [--output ]
  2. Use --json for structured data.
  3. Use --max-pages N for testing or very long documents.
  4. Use --quiet to suppress progress logs.

Requirements

  • A valid PDF file path.
  • GOOGLE_API_KEY set in the process environment (e.g. export GOOGLE_API_KEY=your-key).

CLI options

OptionDescription
---------------------
pdf_pathOne or more PDF file paths (positional)
--max-pages NLimit pages per PDF
--jsonOutput structured JSON instead of plain text
--output FILEWrite result to file (default: stdout)
--quietSuppress INFO/DEBUG logs

版本历史

共 1 个版本

  • v0.1.7 当前
    2026-03-30 15:13 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Baidu Wenku AIPPT

ide-rea
使用百度文库 AI 智能生成 PPT,自动根据内容选择模板。
★ 66 📥 46,163
content-creation

AdMapix

fly0pants
广告情报与应用数据分析助手,支持搜索广告素材、分析应用排名、下载量、收入及市场洞察,用于广告素材和竞品分析。
★ 295 📥 136,450
content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 859 📥 199,553