HWP/HWPX/PDF extraction pipeline: attempt hwp-reader, then pyhwp, then OCR, with safe fallbacks. Use when agent needs reliable text extraction from Korean HW...
heoboong
未分类clawhubv1.0.0100000Key: 无需
★ 0
Stars
📥 438
下载
💾 0
安装
概述
hwp-extract-pipeline
간단한 HWP/HWPX/PDF 추출 파이프라인 스킬입니다. 핵심 목표는 로컬에 저장된 공고문(한글 파일)을 안정적으로 텍스트로 변환해 JSON 형식으로 반환하는 것입니다.
간단 사용법
실행 스크립트: scripts/extract_hwp.py
입력: 로컬 파일 경로(예: /home/vorox/.openclaw/agents/nalda-mail-opt/data//getImageFile.do)