← 返回
未分类 Key

image图像生图(支持banana、gpt-image-2)

让Claw通过第三方中转 API 生成高质量图片,兼容大部分以New API、One API搭建的中转站,支持调用2026年4月最新发布的gpt-image-2生图模型。中转推荐:xy.poloapi.com
HenryChen
未分类 community v3.0.0 3 版本 99826.1 Key: 需要
★ 5
Stars
📥 1,048
下载
💾 50
安装
3
版本
#latest

概述

✨ API Image

通过 API 接口生成图片,不绑定任何中转服务商,支持 GeminiOpenAI DALL-E最新的GPT-Image-2 模型,开箱即用。

✨ 核心特性

特性说明
------------
🌐 多模型支持自动识别模型家族,支持 Gemini、DALL-E、GPT-Image等
🖼️ 参考图支持Gemini 天然支持多张参考图输入,适合图片编辑、风格融合

| 📐 智能参数映射 | 自动将宽高比映射为对应模型支持的尺寸

🔧 开箱即用安装后用户只需要把 API 信息发给智能体,自动完成配置
🛡️ 安全通用技能不内置任何 API Key、服务地址、模型名称,完全由用户配置
⏱️ 合理超时默认 5 分钟超时,适配图片生成的长时间等待
🎯 错误友好提前配置检查、清晰错误提示,避免不必要的请求扣费

📖 支持的模型

模型家族识别关键字支持特性
-----------------------------
Geminigemini参考图、温度参数、宽高比、分辨率 (512/1K/2K/4K)
DALL-Edall-e / dalle尺寸 (1024x1024 / 1792x1024 / 1024x1792)、画质 (standard/hd)、风格 (vivid/natural)
GPT-Imagegpt-image尺寸 (1024x1024 / 1536x1024 / 1024x1536)、画质 (low/medium/high/auto)、背景 (transparent/opaque/auto)、多图 (1-10张)
Bananabanana标准 OpenAI 兼容参数

📖 安装使用

🚀 安装后第一步

安装完成后,将以下信息发给你的智能体即可完成配置

- API Key: 你的令牌密钥
- Base URL: 你的中转站请求地址
- Model: 模型名称(请根据中转站命名方式填写)
- API Type: google  # 可选值: google, openai(也可以不填,自动识别)

智能体帮你完成配置,之后会生成一张测试图片验证接口连通性。

⌨️ 命令行使用(手动)

# 检查配置
./skills/api-image/scripts/api_image.py check

# 纯文本生成(通用)
./skills/api-image/scripts/api_image.py generate "你的提示词" -o output.png -r 16:9

# Gemini 专用参数
./skills/api-image/scripts/api_image.py generate "你的提示词" -o output.png -r 16:9 -R 2K -t 0.9

# DALL-E 专用参数
./skills/api-image/scripts/api_image.py generate "你的提示词" -o output.png -r 16:9 -q hd --style vivid

# GPT-Image 专用参数
./skills/api-image/scripts/api_image.py generate "你的提示词" -o output.png -r 16:9 -q high --background transparent -n 4

# 参考图生成(仅 Gemini)
./skills/api-image/scripts/api_image.py reference ref1.png ref2.png -p "把这两张图融合成一张新图" -o output.png

⚙️ 参数说明

通用参数

参数说明
------------
-p/--prompt提示词/编辑指令 (参考图生成必填)
-o/--output输出图片文件名/路径 (默认 output.jpg),多图时支持 {i} 占位符
-r/--aspect-ratio图片宽高比,例如 1:1/16:9/9:16/4:3/3:4
--api-typeAPI 类型 (google/openai),默认从模型自动识别
--base-urlAPI 基础地址,默认从配置读取
--model模型名称,默认从配置读取
--api-keyAPI Key,默认从配置读取
--timeout请求超时(秒,默认 300

Gemini 专用

参数说明
------------
-t/--temperature温度 (0-1,默认 0.9)
-R/--resolution图片分辨率,可选 512/1K/2K/4K

OpenAI DALL-E 专用

参数说明
------------
-s/--size图片尺寸,例如 1024x1024/1792x1024 (优先使用 --aspect-ratio)
-q/--quality画质,可选 standard/hd
--style风格,可选 vivid (鲜艳)/natural (自然)

GPT-Image 专用

参数说明
------------
-s/--size图片尺寸,例如 1024x1024/1536x1024 (优先使用 --aspect-ratio)
-q/--quality画质,可选 low/medium/high/auto
--background背景,可选 transparent/opaque/auto
--moderation内容审核,可选 auto/low
-n/--number生成图片数量,支持 1-10 张

🔧 技术实现细节(供开发者参考)

模型识别逻辑

  • Gemini: 模型名包含 gemini → 使用 Google 协议,标准 Gemini 格式
  • DALL-E: 模型名包含 dall-edalle → 使用 OpenAI 协议,DALL-E 特有参数
  • GPT-Image: 模型名包含 gpt-image → 使用 OpenAI 协议,GPT-Image 特有参数
  • Banana: 模型名包含 banana → 使用 OpenAI 协议,标准参数

Gemini imageConfig

Gemini 支持通过 image_config 设置:

  • aspect_ratio: 1:1, 1:4, 1:8, 2:3, 3:2, 3:4, 4:1, 4:3, 4:5, 5:4, 8:1, 9:16, 16:9, 21:9
  • image_size: 512, 1K, 2K, 4K

宽高比自动映射

DALL-E / Banana:

  • 1:11024x1024
  • 16:9 / 4:31792x1024
  • 9:16 / 3:41024x1792

GPT-Image:

  • 1:11024x1024
  • 16:9 / 4:31536x1024
  • 9:16 / 3:41024x1536

响应解析

Google 协议: data.candidates[0].content.parts[0].inlineData.data

OpenAI 协议:

  • 优先: data.data[0].b64_json
  • 备选: data.data[0].urldata.images[0].url

多图生成策略

  • DALL-E: 强制 n=1(官方限制)
  • GPT-Image: 支持 n=1-10
  • Gemini: 单次请求只返回一张

技能做好了通用化设计,不管你用哪个中转,只要支持标准协议就能用,是你图片生成的通用利器 🎉

版本历史

共 3 个版本

  • v3.0.0 1.增加支持gpt-image-2生图模型 2.增加自动根据模型识别接口功能 当前
    2026-04-22 15:21 安全 安全
  • v2.0.0 修改技能介绍,增加多张参考图,更丰富的参数配置。
    2026-04-15 18:04 安全 安全
  • v1.0.0 Initial release
    2026-04-15 17:08 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 427 📥 116,438
design-media

Video Frames

steipete
使用 ffmpeg 从视频中提取帧或短片。
★ 133 📥 52,725
design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 330 📥 93,295