← 返回
内容创作 Key

Image Gen

Nano-banana 图像生成与编辑 Skill。支持文生图和图生图,根据文字描述或参考图使用 AI 生成/编辑图像,自动压缩大图,保存到 workspace/img 目录,并直接在飞书中展示。 触发场景:用户要求生成图片、画图、AI 绘图、创建图像、修改图片、基于图片生成、图生图。
Nano-banana 图像生成与编辑 Skill。支持文生图和图生图,根据文字描述或参考图使用 AI 生成/编辑图像,自动压缩大图,保存到 workspace/img 目录,并直接在飞书中展示。 触发场景:用户要求生成图片、画图、AI 绘图、创建图像、修改图片、基于图片生成、图生图。
zweien
内容创作 clawhub v0.1.0 1 版本 99768.4 Key: 需要
★ 0
Stars
📥 2,154
下载
💾 8
安装
1
版本
#latest

概述

Nano-banana 图像生成与编辑 Skill

使用 Nano-banana-3.1-Flash API 进行图像生成与编辑,支持:

  • 文生图 (text-to-image): 根据文字描述生成图像
  • 图生图 (image-to-image): 基于参考图生成新图像

自动压缩超过 1MB 的图片,保存到 workspace,并直接在飞书中展示。

配置

在workspace目录下创建 .env 文件:

# .env
IMAGE_API_BASE_URL=https://api.imyaigc.top
IMAGE_API_KEY=your-api-key-here
IMAGE_MODEL=gemini-3.1-flash-image-preview
IMAGE_SIZE=2K
IMAGE_ASPECT_RATIO=1:1

图片保存位置

所有生成的图片保存在:

~/.openclaw/workspace/img/

文件名格式:image_YYYYMMDD_HHMMSS.png

压缩规则:

  • 原始图片保存为:image_YYYYMMDD_HHMMSS_original.png
  • 如果原图 > 1MB,自动压缩并保存为:image_YYYYMMDD_HHMMSS.png
  • 发送到时使用压缩后的版本

使用方法

1. 文生图 (Text-to-Image)

直接告诉我要生成什么图片:

示例:

  • "生成一张夕阳下的海滩图片"
  • "画一只可爱的猫咪"
  • "创建一个赛博朋克风格的大龙虾,16:9 比例"

2. 图生图 (Image-to-Image)

提供参考图和修改描述:

示例:

  • "基于这张图,改成水彩风格"
  • "把这张图改成夜景"
  • "参考这张图,生成一个类似风格的建筑"
  • "把这张照片变成油画风格"

工作流程:

  1. 用户提供参考图(发送图片)
  2. 下载图片并转为 base64
  3. 调用 API 时传入 image 参数
  4. 返回基于参考图生成的新图像

工作流程

文生图流程

  1. 解析参数
    • 提取提示词
    • 识别宽高比参数(如 "16:9"、"1:1")
  1. 调用 API

```bash

curl -X POST "${IMAGE_API_BASE_URL}/v1/images/generations" \

-H "Authorization: Bearer ${IMAGE_API_KEY}" \

-H "Content-Type: application/json" \

-d '{

"model": "'"${IMAGE_MODEL}"'",

"prompt": "描述内容",

"response_format": "url",

"aspect_ratio": "16:9"

}'

```

图生图流程

  1. 获取参考图
    • 用户发送图片
    • 下载图片并转为 base64
  1. 调用 API

```bash

curl -X POST "${IMAGE_API_BASE_URL}/v1/images/generations" \

-H "Authorization: Bearer ${IMAGE_API_KEY}" \

-H "Content-Type: application/json" \

-d '{

"model": "'"${IMAGE_MODEL}"'",

"prompt": "修改描述(如:改为水彩风格)",

"response_format": "url",

"aspect_ratio": "16:9",

"image": ["data:image/png;base64,iVBORw0KGgo..."]

}'

```

  1. 获取图片 URL
    • 从响应中提取 data[0].url
  1. 下载并保存原始图片

```bash

OUTPUT_DIR=~/.openclaw/workspace/img

TIMESTAMP=$(date +%Y%m%d_%H%M%S)

ORIGINAL_FILE="${OUTPUT_DIR}/image_${TIMESTAMP}_original.png"

FINAL_FILE="${OUTPUT_DIR}/image_${TIMESTAMP}.png"

curl -o "$ORIGINAL_FILE" "$IMAGE_URL"

```

  1. 检查大小并压缩(如需要)

```bash

FILE_SIZE=$(stat -f%z "$ORIGINAL_FILE" 2>/dev/null || stat -c%s "$ORIGINAL_FILE")

MAX_SIZE=$((1024 * 1024)) # 1MB

if [ "$FILE_SIZE" -gt "$MAX_SIZE" ]; then

echo "图片超过 1MB,正在压缩..."

python3 compress_image.py "$ORIGINAL_FILE" "$FINAL_FILE" 1

else

cp "$ORIGINAL_FILE" "$FINAL_FILE"

fi

```

  1. 发送到飞书

如果在飞书对话中,注意以下发送方式

```

message(

action="send",

channel="feishu",

accountId="second",

target="用户或群组ID",

media="~/.openclaw/workspace/img/image_xxx.png"

)

```

压缩工具

使用 compress_image.py 进行图片压缩:

# 用法
python3 compress_image.py <input> <output> [max_size_mb]

# 示例
python3 compress_image.py original.png compressed.png 1

压缩策略:

  1. 如果图片 ≤ 1MB,不压缩
  2. 如果图片 > 1MB:
    • 逐步降低 JPEG 质量 (85 → 10)
    • 如果仍超过限制,缩小尺寸 (90% → 30%)
  3. 保留原始文件,压缩结果另存

支持的参数

宽高比 (aspect_ratio)

  • 1:1 - 正方形(默认)
  • 4:3, 3:4 - 标准比例
  • 16:9, 9:16 - 宽屏/竖屏
  • 2:3, 3:2 - 照片比例
  • 4:5, 5:4 - 接近正方形
  • 21:9 - 超宽屏
  • 1:4, 4:1 - 长条形
  • 8:1, 1:8 - 超长条形

图像尺寸 (image_size)

  • 1K - 适合快速预览
  • 2K - 推荐默认(默认)
  • 4K - 高清大图
  • 512px - 小图

参考图 (image)

  • 类型:字符串数组
  • 格式:URL 或 base64 编码(推荐 data:image/png;base64,... 格式)
  • 支持:单张或多张参考图

API 信息

  • Endpoint: POST /v1/images/generations
  • 认证: Authorization: Bearer {{YOUR_API_KEY}}
  • 模型: ${IMAGE_MODEL} (默认: gemini-3.1-flash-image-preview)
  • Base URL: https://api.imyaigc.top

完整请求参数

参数类型必填说明
------------------------
modelstring模型名称
promptstring生成描述
response_formatstringurlb64_json
aspect_ratiostring宽高比
imagearray参考图数组(URL 或 base64)
image_sizestring图像尺寸(仅 nano-banana-2 支持)

目录结构

~/.openclaw/workspace/
├── img/                          # 生成的图片保存目录
│   ├── image_20260302_221900_original.png  # 原始图片
│   ├── image_20260302_221900.png           # 压缩后(用于发送)
│   └── ...
└── skills/
    └── image-gen/
        ├── SKILL.md              # 本说明文件
        ├── image-gen.sh          # 生成脚本
        ├── compress_image.py     # 压缩工具
        ├── .env                  # API 配置
        └── .env.example          # 配置示例

注意事项

  1. 图片必须保存在 ~/.openclaw/workspace/img/ 目录
  2. 超过 1MB 的图片会自动压缩后再发送到飞书
  3. 原始图片保留,方便后续使用
  4. 文件名使用时间戳避免冲突
  5. 提示词会自动翻译为英文以获得更好的生成效果
  6. API 调用可能需要 30-60 秒,请告知用户等待
  7. 图生图时:参考图会转为 base64 传入 API 的 image 参数

版本历史

共 1 个版本

  • v0.1.0 当前
    2026-03-31 09:20 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Baidu Wenku AIPPT

ide-rea
使用百度文库 AI 智能生成 PPT,自动根据内容选择模板。
★ 66 📥 46,160
content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 859 📥 199,546
content-creation

AdMapix

fly0pants
广告情报与应用数据分析助手,支持搜索广告素材、分析应用排名、下载量、收入及市场洞察,用于广告素材和竞品分析。
★ 295 📥 136,448