← 返回
未分类 Key

minimax-tokenplan-image-generation

Generate images using MiniMax image-01 model. Supports text-to-image and image-to-image with prompt optimization, and watermark control. Preferred skill for...
使用 MiniMax image-01 模型生成图像。支持文本到图像和图像到图像的生成,具备提示词优化和水印控制功能。首选技能...
4833675 4833675 来源
未分类 clawhub v0.9.5 1 版本 100000 Key: 需要
★ 0
Stars
📥 342
下载
💾 0
安装
1
版本
#latest

概述

MiniMax Image Generation Skill

前置条件

  • Python 3 已安装
  • requests 库pip3 install requests

init

需要初始化以下信息:

第一步:获取 API Key

向用户获取 MiniMax API Key(sk-cp- 开头的 Token Plan key,或普通 API Key)。

第二步:确认配置

向用户确认:

  • API Key 是否正确
  • 使用哪个区域:
  • CNapi.minimaxi.com(中国版,支持 image-01 + image-01-live)
  • Globalapi.minimaxi.io(国际版,仅支持 image-01)

第三步:填写配置

获取以上信息后:

  1. 修改 scripts/generate.py 顶部的配置常量(API_KEYBASE_URLREGION),填入实际值
  2. 同时更新下方 ## 配置 区段的表格,作为配置记录

第四步:清理

配置填写完成后,删除本 ## init 区段(包括 ### 需要初始化以下信息 的全部内容),仅保留 ## 配置 区段


配置

注意

  • Global(api.minimaxi.io)仅支持 image-01 模型,不支持 image-01-live
  • CN(api.minimaxi.com)支持 image-01image-01-live
配置项说明
-------------------
MINIMAX_API_KEY<待填入>初始化时替换为实际 key
BASE_URL<待填入>CN: https://api.minimaxi.com / Global: https://api.minimaxi.io

快速使用

1️⃣ 文生图(Text-to-Image)

SKILL_DIR="~/.openclaw/workspace/skills/minimax-tokenplan-image-generation"
python3 "$SKILL_DIR/scripts/generate.py" \
    --prompt "你的图片描述" \
    --aspect-ratio "16:9"

> 注意:以下示例中 generate.py 均指 ~/.openclaw/workspace/skills/minimax-tokenplan-image-generation/scripts/generate.py 的完整路径。

参数说明:

参数必填说明默认值
--------------------------
--prompt图片描述,最长 1500 字符,超出会报错-
--aspect-ratio宽高比16:9
--output输出路径自动生成
--n生成数量(最大9)1
--api-keyAPI Key(默认使用文件顶部配置)-
--base-urlBase URL(默认使用文件顶部配置)-
--response-format返回格式:base64(保存图片)或 url(返回链接,24小时有效)base64

aspect_ratio 可选值: 16:9 / 9:16 / 1:1 / 3:2 / 2:3

示例:

# 生成16:9风景图
python3 generate.py --prompt "日出时分雪山倒映在湖面,温暖的金色光线" --aspect-ratio "16:9"

# 生成9:16竖版人像
python3 generate.py --prompt "未来风格的城市夜景,赛博朋克" --aspect-ratio "9:16"

2️⃣ 图生图(Image-to-Image)

在文生图基础上,添加 --image-url 参数传入参考图:

python3 "$SKILL_DIR/scripts/generate.py" \
    --prompt "新的图片描述" \
    --image-url "/path/to/reference.jpg" \
    --aspect-ratio "9:16"

--image-url 支持两种格式:

  1. 公网 URL(直接使用,无需下载)

```bash

--image-url "https://example.com/image.jpg"

```

如果是 http://https:// 开头,直接传递给模型,不做下载和转换。

  1. 本地文件路径(转为 base64)

```bash

--image-url "/path/to/reference.jpg"

```

脚本会自动读取本地文件并转为 base64 Data URL 发送给 API。

图生图规则:

  • type 固定为 "character"(保持人物/主体特征)
  • 最多 1 张参考图
  • 图片大小限制:小于 10MB

示例:

# 以本地图片为参考(推荐方式)
python3 generate.py \
    --prompt "机械外骨骼大龙虾,在太空中战斗" \
    --image-url "/path/to/my-lobster.jpg" \
    --aspect-ratio "9:16"

工作流总结

图生图完整流程

  1. 用户提供参考图片
  2. 脚本自动处理 → 读取图片 → 转为 base64 Data URL
  3. 调用 API → subject_reference 传入 base64 数据
  4. 生成新图 → 返回图片 URL 或 base64

Prompt 处理规则

不传 --prompt-optimizer / --no-prompt-optimizer 时,脚本会自动判断(阈值:40 字符):

情况处理方式
---------------
prompt < 40 字符(短描述)脚本自动开启 prompt_optimizer,丰富描述细节
prompt ≥ 40 字符(长描述)脚本自动关闭 prompt_optimizer,保留用户原意
用户明确说「不要改prompt」/「保持原样」--no-prompt-optimizer,强制关闭
用户明确要求优化 prompt--prompt-optimizer,强制开启
用户要求多张设置 --n 4(最大9)

水印规则

情况处理方式
---------------
默认aigc_watermark: false
prompt 含「水印/版权/标识/logo/watermark/copyright」等关键词aigc_watermark: true 自动开启

response_format 规则

情况处理方式
---------------
默认使用 base64,脚本自动解码保存 PNG
用户明确要求"返回链接"、"返回URL"、"给我网络地址"等--response-format url(返回 URL,注意:链接有效期仅24小时

示例:

# 要求返回网络链接
python3 generate.py --prompt "大龙虾在太空中战斗" --response-format url
# 输出:https://...
# 注意:返回的 URL 只有 24 小时有效期

文件存储

  • 默认保存到~/.openclaw/media/minimax/(多 Agent 共享目录)
  • 文件名格式minimax-YYYY-MM-DD-.png
  • prompt_slug:取 prompt 关键词,英文前6词 + 中文前3词,空格变 -

脚本输出格式

调用 generate.py 后,stdout 输出生成结果,格式如下:

response_formatstdout 输出示例
-----------------------------------
base64(默认)保存后的文件绝对路径/Users/x/.openclaw/media/minimax/minimax-2026-03-27-sunset.png
url图片的公网 URL(24小时有效)https://filecdn.minimax.chat/...
多张图片(--n 2+用 ` \` 分隔`path1.png \path2.png`

> 所有日志信息([INFO][WARN][ERROR])输出到 stderr,不会混入 stdout。


错误处理

code含义处理
------------------
0成功继续
1002限流提醒用户 API 限流中,建议稍后重试
1004鉴权失败检查 API Key
1008余额不足提醒充值
1026敏感词换词后重试
2013参数异常检查入参(可能是 URL 格式不对)
2049无效 Key检查 Key 是否正确

版本历史

共 1 个版本

  • v0.9.5 当前
    2026-05-03 10:26 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 435 📥 117,827
design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 335 📥 94,636
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 227 📥 48,783