在用户想识别本地图片中的文字、表格或截图内容时使用这个 skill。优先通过命令行参数收集配置,不要要求用户手改 skill 包里的文件。
--api-key、--model-id、--base-url 等必要配置。--config 传给脚本。content 字段。安装依赖:
pip install openai
最小调用:
python3 "${CLAUDE_SKILL_DIR}/scripts/bigmodel_ocr_recognizer.py" "image.png" \
--api-key "$IFLYTEK_API_KEY" \
--model-id "your-model-id" \
--base-url "https://maas-api.cn-huabei-1.xf-yun.com/v2"
带自定义提示词:
python3 "${CLAUDE_SKILL_DIR}/scripts/bigmodel_ocr_recognizer.py" "image.png" \
--api-key "$IFLYTEK_API_KEY" \
--model-id "your-model-id" \
--base-url "https://maas-api.cn-huabei-1.xf-yun.com/v2" \
--prompt "提取表格并输出为 Markdown"
IFLYTEK_API_KEY。--config 指定的 JSON 文件。assets/config.template.json 只是模板,不能直接当真实凭证使用。references/configuration.mdreferences/examples.mdassets/config.template.json共 1 个版本