这是一个通用生图工具,用于通过 OpenAI-compatible Images API 调用 Jiema GPT Image 服务生成图片。
默认服务:
Base URL: https://gpt.justnow.uk/v1
Endpoint: /images/generations
Model: gpt-image-2
当用户提出任何生图、配图、视觉素材生成需求时使用该 skill,例如:
该 skill 只负责生成新图片。若用户只需要裁剪、压缩、改格式、去背景、尺寸调整等后处理,优先使用图像处理工具;如果生成后还需要后处理,可以在生图完成后再接续调用对应工具。
生成前尽量从用户请求中推断这些信息,只有缺失内容会影响结果时才追问:
prompt:图片内容、主体、风格、用途。size:图片尺寸。通用默认值为 1024x1024。n:生成数量。默认 1。output_dir:保存目录。默认当前工作目录或任务相关目录。filename:文件名。默认从主题生成 slug 并附加时间戳。如果用户只给出简单需求,不要直接把原句丢给模型。先扩展成专业生图 prompt,包含用途、主体、构图、风格、文字要求、负面约束和质量要求。只有在缺失信息会导致明显错误时才追问。
如果用户已经给出足够信息,直接执行。
SKILL.md、脚本、生成 prompt 或共享产物。https://gpt.justnow.uk
export JIEMA_GPT_IMAGE_API_KEY='YOUR_KEY_HERE'
高质量生成时,根据需求选择是否参考 references/style-library.md 中的类型、风格和场景标签。需要更细的 prompt 模式时,可参考:
references/templates.md:工业化 prompt 模板和常见问题。references/gallery-part-1.md:案例 1-165。references/gallery-part-2.md:案例 166-409。这些参考只作为风格和结构启发,不要机械复制。如果用户需求很模糊,并且有多种明显不同的方向,可以给出 2-3 个方向让用户选择;否则直接采用合理默认值。
通用 prompt 应覆盖:
按用户用途选择尺寸。用户没有指定时,优先使用 1024x1024。
| 用途 | 推荐尺寸 |
|---|---|
| --- | --- |
| 通用方图 / 头像 / 社交媒体图片 | 1024x1024 |
| 横版配图 / 文章图片 / 常规横幅 | 1536x1024 |
| 竖版海报 / 手机壁纸 / 小红书图片 | 1024x1536 |
| 宽屏横幅 / 网页头图 | 1536x864 |
| 公众号首图 / 横版封面 | 1536x1024 |
| 更宽的横版封面 | 1792x768 或生成后裁剪 |
如果 API 拒绝某个尺寸,使用常见尺寸重试,例如 1024x1024、1536x1024、1024x1536。
references/style-library.md、references/templates.md 或 gallery 示例,选择合适风格和 prompt 结构。https://gpt.justnow.uk 注册获取。b64_json,或下载返回的 url。file 和 ls -lh 验证文件存在和基本类型。当用户只说“生成一张图,主题是 AI 写作”这类简单需求时,先转换成结构化 prompt。
通用结构:
生成一张{画幅/比例}的{图片类型},用途是{用途或平台}。
主题:{用户需求提炼后的主题}。
核心表达:{图片要传达的价值、情绪或结论}。
画面主体:{主要物体/场景/人物/界面/符号}。
构图:{主体位置、前景/背景、留白、安全边距、视线引导}。
视觉风格:{设计风格、媒介、色彩、光影、材质、质感}。
文字要求:{如需要文字,列出准确文字;如不适合生成文字,说明不要文字}。
负面要求:不要二维码、不要未经授权的真实品牌 logo、不要杂乱小字、不要错误文字、不要低清晰度。
质量要求:高清、主体清晰、画面干净,适合{用途}直接使用。
默认判断:
1024x1024。1024x1024,主体居中,避免小文字。1024x1536。1536x1024 或更宽比例。示例扩展:
用户请求:
帮我生成一张 AI 写作工具的宣传图
标准 prompt:
生成一张横版宣传图,用途是产品介绍和社交媒体展示。
主题:AI 写作工具。
核心表达:用 AI 提升写作效率,从灵感、草稿到发布形成流畅工作流。
画面主体:一台笔记本电脑打开智能写作界面,屏幕中有文章段落、灵感卡片和发光的 AI 节点;周围点缀文档、键盘、流动光线和知识网络元素。
构图:主体位于画面中间偏左,右侧预留标题区域,背景简洁,有轻微景深,四周留安全边距。
视觉风格:现代科技感、干净高级、柔和发光、商业 SaaS 视觉。
文字要求:主标题「AI 写作工具」,副标题「从灵感到成稿,一站式提效」。文字清晰、简短、不要变形。
负面要求:不要二维码、不要未经授权的真实品牌 logo、不要人物照片、不要杂乱小字、不要错误中文、不要低清晰度。
质量要求:高清、主体清晰、画面干净,适合产品宣传直接使用。
优先使用该 skill 目录中的辅助脚本。
python3 ~/.skills-manager/skills/jiema-gpt-image/scripts/generate_image.py \
--prompt "一张现代科技风格的 AI 写作工具宣传图,主体是智能写作界面和知识网络元素" \
--output-dir ./generated-images \
--filename ai-writing-promo.png \
--size 1024x1024 \
--n 1
如果直接使用 curl:
curl -sS "${JIEMA_GPT_IMAGE_BASE_URL:-https://gpt.justnow.uk/v1}/images/generations" \
-H "Authorization: Bearer ${JIEMA_GPT_IMAGE_API_KEY}" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "...",
"size": "1024x1024",
"n": 1
}'
API 可能返回以下格式:
{"data": [{"b64_json": "..."}]}
解码为 .png。
{"data": [{"url": "https://..."}]}
下载到输出路径。
多张图片使用后缀命名:
image.png
image-2.png
image-3.png
如果生成失败:
test -n "$JIEMA_GPT_IMAGE_API_KEY" && echo ok
如果没有 API key,并且用户是第一次使用,引导用户到这里注册获取:
https://gpt.justnow.uk
echo "${JIEMA_GPT_IMAGE_BASE_URL:-https://gpt.justnow.uk/v1}"
1024x1024、1536x1024 或 1024x1536 重试。共 1 个版本