MiniMax 图片生成技能
功能概览
| 功能 | API 端点 | 说明 |
|---|
| ------ | ---------- | ------ |
| 文生图 | /v1/image_generation | 从文本描述生成图片 |
| 图生图 | /v1/image_generation | 基于参考图 + 文本生成新图 |
工作流程
文生图
文本描述 → API 调用 → 自动保存本地 → 返回路径
图生图
参考图 + 文本描述 → API 调用 → 自动保存本地 → 返回路径
快速开始
文生图
import requests
import os
import base64
API_KEY = os.getenv("MINIMAX_API_KEY")
URL = "https://api.minimaxi.com/v1/image_generation"
payload = {
"model": "image-01",
"prompt": "一只可爱的小老虎在森林里",
"aspect_ratio": "16:9",
"n": 1,
"response_format": "url"
}
headers = {
"Authorization": f"Bearer {API_KEY}",
"Content-Type": "application/json"
}
response = requests.post(URL, json=payload, headers=headers)
result = response.json()
image_url = result["data"]["image_urls"][0]
# 自动下载保存
save_dir = os.path.expanduser("~/.openclaw/workspace/assets/images")
os.makedirs(save_dir, exist_ok=True)
filename = f"generated_{int(time.time())}.jpeg"
save_path = os.path.join(save_dir, filename)
img_response = requests.get(image_url)
with open(save_path, 'wb') as f:
f.write(img_response.content)
print(f"图片已保存: {save_path}")
图生图
# 读取本地图片并转为 Base64
with open("reference.jpg", "rb") as f:
img_base64 = base64.b64encode(f.read()).decode()
payload = {
"model": "image-01",
"prompt": "same person wearing traditional Chinese Hanfu",
"aspect_ratio": "3:4",
"n": 1,
"subject_reference": [
{
"type": "character",
"image_file": f"data:image/jpeg;base64,{img_base64}"
}
]
}
支持的模型
| 模型 | 说明 | 适用场景 |
|---|
| ------ | ------ | ---------- |
image-01 | 高质量图片生成 | 通用场景 |
image-01-live | 带风格的图片生成 | 需要漫画/水彩等风格 |
核心参数
| 参数 | 类型 | 必填 | 说明 |
|---|
| ------ | ------ | ------ | ------ |
model | string | 是 | image-01 或 image-01-live |
prompt | string | 是 | 图片描述,最长 1500 字符 |
n | int | 否 | 生成数量 [1, 9],默认 1 |
subject_reference | array | 否 | 参考图配置(图生图用) |
style | object | 否 | 风格设置(仅 image-01-live) |
aspect_ratio | string | 否 | 宽高比 |
subject_reference 结构
| 字段 | 类型 | 必填 | 说明 |
|---|
| ------ | ------ | ------ | ------ |
type | string | 是 | 当前仅支持 character |
image_file | string | 是 | 参考图 URL 或 Base64 |
参考图要求
- 格式:JPG, JPEG, PNG
- 大小:小于 10MB
- 最佳效果:单人正面照片
宽高比
| 值 | 分辨率 |
|---|
| ---- | -------- |
1:1 | 1024x1024 |
16:9 | 1280x720 |
4:3 | 1152x864 |
3:2 | 1248x832 |
2:3 | 832x1248 |
3:4 | 864x1152 |
9:16 | 720x1280 |
21:9 | 1344x576 (仅 image-01) |
风格类型(仅 image-01-live)
| 风格 | 说明 |
|---|
| ------ | ------ |
漫画 | 漫画风格 |
元气 | 元气/活力风格 |
中世纪 | 中世纪风格 |
水彩 | 水彩画风格 |
输出目录
生成的图片默认保存在:~/.openclaw/workspace/assets/images/
文件名格式:{type}_{timestamp}_{index}.jpeg
type: text2img / img2imgtimestamp: Unix 时间戳index: 多图时的序号
脚本工具
scripts/generate_image.py - 文生图工具(自动保存本地)scripts/image_to_image.py - 图生图工具(自动保存本地)
命令行用法
# 文生图
python generate_image.py "一只可爱的小老虎" --ratio 16:9 --n 3
# 图生图
python image_to_image.py "穿汉服的女孩" --ref path/to/image.jpg --ratio 3:4
API 参考