← 返回
未分类 Key

腾讯云信息图生成器

信息图(infographic)生成器。当用户提出「做一张信息图 / 做一张海报 / 把这份内容做成一张图 / 把方案画成图 / 生成科普图 / 生成知识卡片 / 生成宣传图 / 高信息密度的图」等需求时使用。流程:先把用户的实际内容结构化成"信息图蓝图"(标题+模块+流程+视觉锚点),再依据**用户给的具体内容**单独规划版式(不强行套参考图),用高端企业科技风朋友圈长图/专业 SaaS 产品宣传长图风格生成中文 prompt,默认必须包含腾讯云 logo 与 Q版企鹅形象,最后调用腾讯云 VOD `CreateAigcImageTask`(默认 `OG/image2_medium`、2K)出图。支持给参考图迁移视觉风格与信息密度。
信息图(infographic)生成器。当用户提出「做一张信息图 / 做一张海报 / 把这份内容做成一张图 / 把方案画成图 / 生成科普图 / 生成知识卡片 / 生成宣传图 / 高信息密度的图」等需求时使用。流程:先把用户的实际内容结构化成"信息图蓝图"(标题+模块+流程+视觉锚点),再依据**用户给的具体内容**单独规划版式(不强行套参考图),用高端企业科技风朋友圈长图/专业 SaaS 产品宣传长图风格生成中文 prompt,默认必须包含腾讯云 logo 与 Q版企鹅形象,最后调用腾讯云 VOD `CreateAigcImageTask`(默认 `OG/image2_medium`、2K)出图。支持给参考图迁移视觉风格与信息密度。
任准
未分类 community v1.0.0 1 版本 100000 Key: 需要
★ 1
Stars
📥 87
下载
💾 0
安装
1
版本
#latest

概述

Infographic Generator

Overview

把任意中文内容/需求 → 一张高信息密度的中文信息图。

核心原则(务必牢记):

  1. 默认 9:16 竖版:信息图天生为移动端阅读设计,默认必须 --aspect 9:16。除非用户明确说"做横版/方图/16:9/1:1",否则不要改画幅。即便用户给的参考图是横图,也只取它的"风格",画幅仍然 9:16。
  2. 内容驱动版式:参考图只是用来对齐"风格 + 信息密度量级",真正的排版、模块数量、流程是几步、对比是几列、用什么图标,必须根据用户的具体内容重新规划。绝不照抄参考图的"6 卡片 + 4 步流程 + VS 对比"——内容只有 3 个论点就只画 3 个;内容是时间线就画时间线,不强行塞 VS。
  3. 写死才靠谱:模型把 prompt 当排版稿。颜色给十六进制、模块给数量、文字给原文、位置给方位词。越具体越准。
  4. 默认 medium + 2K:除非用户明确指定,出图参数固定为 --quality medium --resolution 2K;若小字号中文仍糊,再迭代升到 high。
  5. 默认腾讯云品牌/IP:每张图必须出现腾讯云 logo(文字不得拼错)和 Q版企鹅形象;企鹅默认作为主视觉锚点或页脚陪伴角色。
  6. 只模仿风格,不固定排版:写提示词时模仿“高端企业科技风朋友圈长图 / 专业 SaaS 产品宣传长图”的质感、信息密度、字体层级、卡片语言和商业方案感;排版结构每次必须根据用户内容重新设计,不要固定套“标题区 + 主视觉 + 方法论 + VS + 金句”。不要默认传参考图;除非用户明确提供并要求使用参考图。
  7. 颜色克制,不花哨:默认只用腾讯云科技蓝、白色、浅蓝、深蓝,紫色只做少量渐变强调;不要五颜六色、花花绿绿、彩虹渐变或大面积黄/橙/红/绿。每个卡片文字短,但整体内容不能空。若正文可见文字超过约 700 字,再拆系列图。
  8. 默认作者署名:底部署名或品牌栏默认加入“任准(marcusren)”,除非用户明确要求隐藏署名。

何时不用这个 skill

  • 只是要张普通插画/产品图/真人摄影 → 用 xyq-nest-skillhunyuan-image-generator
  • 要做 PPT 演讲分镜 → 用 pptx
  • 要做交互可视化网页 → 用内置 Visualizer (show_widget)。

Step 0(首次执行必做):检查并加载环境变量

这是硬性前置条件。脚本必须用腾讯云 VOD 的 TENCENTCLOUD_SECRET_ID / TENCENTCLOUD_SECRET_KEY 才能跑。

由于 WorkBuddy 运行在沙箱环境中,shell 配置文件(~/.zshrc 等)不会自动加载,环境变量必须手动 source。 因此,每次执行腾讯云相关命令前,必须先 source ~/.zshrc

# 先加载环境变量(sandbox 不会自动 source)
source ~/.zshrc 2>/dev/null

# 检查是否已配置
[ -n "$TENCENTCLOUD_SECRET_ID" ] && [ -n "$TENCENTCLOUD_SECRET_KEY" ] && echo "✅ 已配置" || echo "❌ 未配置"

如果 source 后仍显示未配置,必须停下来引导用户配置,绝不能降级到 hunyuan-image-generator / xyq-nest-skill / doubao-image-generator 等其他生图。 因为:

  • 用户明确选择本 skill = 想要 GPT-Image2 的中文文字渲染能力,其他模型替代不了
  • 信息图核心需求是"中文不糊",默认用 OG/image2_medium + 2K;如果小字糊,再升 OG/image2_high

引导话术(直接发给用户):

本 skill 需要腾讯云 VOD 的 API Key 才能调 GPT-Image2 出图。请按以下任一方式配置:

方式 A · 临时(当前 shell,sandbox 内不持久):
  export TENCENTCLOUD_SECRET_ID=AKIDxxxxxxxxxxxx
  export TENCENTCLOUD_SECRET_KEY=xxxxxxxxxxxxxxxx

方式 B · 永久(写入 ~/.zshrc,本 skill 会自动 source 加载):
  echo 'export TENCENTCLOUD_SECRET_ID=AKIDxxxx' >> ~/.zshrc
  echo 'export TENCENTCLOUD_SECRET_KEY=xxxx' >> ~/.zshrc

获取 Key:访问 https://console.cloud.tencent.com/cam/capi

安全建议:不要把 SecretId/SecretKey 写进 skill 文件、prompt 或聊天记录;只通过本机环境变量传入。

配置完成后告诉我,我立即出图。

SubAppId 注意事项

脚本默认 SubAppId=0(主应用)。如果使用 VOD 子应用,可通过 --subapp-id <子应用ID> 或环境变量 TENCENTCLOUD_VOD_SUBAPP_ID 指定。处理策略:

  1. 先用默认 0 试一次
  2. 如果报 invalid vod user,去 VOD 控制台 确认自己的子应用 ID
  3. 重新执行时加 --subapp-id <实际子应用ID>,或先设置 export TENCENTCLOUD_VOD_SUBAPP_ID=<实际子应用ID>

绝不因为没 key 就改用其他生图模型——这是错误降级,违背用户选 skill 的本意。


工作流(必须严格按顺序执行)

Step 1:读懂用户内容 → 决定信息图"形态"

先判断这份内容最适合的形态,不要直接套模板。常见形态:

形态触发关键词典型版式
---------
方法论 / 流程图"方法""步骤""流程""路径"横向或竖向 N 步流程 + 每步说明
概念全景图 / 知识图谱"全景""体系""图谱""一图看懂"中心放射 / 矩阵网格 / 楼层式
数据对比图"对比""VS""before-after"左右两栏 + 中间徽章,或表格式
科普解释图"讲解""科普""为什么"主体特写 + 4-6 个标注模块
时间线"发展""历程""演变""路线图"横向 / 竖向时间轴 + 节点卡片
产品/方案介绍"方案""能力""服务""产品"根据内容选择:产品面板 / 能力矩阵 / 场景流程 / 方法论路径 / VS 对比 / 金句收束,不要全量固定套用
数据看板"数据""指标""报表"大数字 + 多类图表

判断不出来就问用户,或同时给 2 种形态备选。

Step 2:内容 → "信息图蓝图"

蓝图必须严格基于用户给的内容,不要凭空发挥。模板:

【形态】:<上面 7 种之一,或自定义>
【画幅】:9:16 竖版(默认;除非用户明确要其他比例)

【主标题】:<不超过 16 字>
【副标题】:<给主标题做注解,14-22 字>

【主体内容】(按形态填,例如流程图就填步骤;对比图就填两栏;放射图就填中心+辐射):
  - 模块 1:<标题> | <一句话说明> | <图标关键词>
  - 模块 2:...
  - ...

【视觉锚点】:Q版企鹅形象(默认必填,可结合用户业务场景变化姿态/道具)
【品牌元素】:腾讯云 logo(默认必填,左上角或页脚品牌区,文字必须写作“腾讯云 / Tencent Cloud”)
【金句】:<可选——12-20 字升华>
【页脚】:腾讯云 / 任准(marcusren) / <可选项目署名>

【配色】:默认 #0052D9 / #0A2A66 / #EAF4FF / #FFFFFF;#7B61FF 仅做少量蓝紫渐变强调。不要五颜六色,不要花花绿绿,不要大面积黄/橙/红/绿。
【字体调性】:中文黑体加粗、标题超大号、关键短语可做蓝紫渐变强调;整体清爽、克制、可信。
【风格关键词】:高端企业科技风朋友圈信息图、专业 SaaS 产品宣传长图、腾讯云科技蓝、白色和浅蓝背景、深蓝标题、克制蓝紫强调、现代 SaaS 控制台、圆角卡片 UI、轻 3D 图标、Q版企鹅、商业方案感、强传播感

Step 3:选 prompt 模板 → 写 prompt

references/prompt-cookbook.md,里面有 8 套来自 awesome-gpt-image-2 的工业级模板(信息图 / 海报 / 科普 / UI 截图 / 概念字体海报 / Apple 极简 / 等距俯视 / 知识卡片)。根据 Step 1 的形态选最匹配的一套,再把 Step 2 的蓝图填进去

默认写 prompt 时使用下面这套“高端企业科技朋友圈长图”写法(只模仿风格,不固定排版,不默认传参考图):

生成一张竖屏 9:16 的高端企业科技风朋友圈信息图海报,内容密度参考专业 SaaS 产品宣传长图,不要太简单,也不要过度拥挤。主题是:

《<用户主题>》

先根据主题内容判断最合适的信息图结构,再设计排版。只模仿高端企业科技/SaaS 长图的风格,不要固定套用某一种版式。内容是流程就做路径/步骤图;内容是能力清单就做能力矩阵或产品工作台;内容是对比就做 VS;内容是理念体系就做分层架构或知识图谱;内容是时间发展就做时间线。不要为了套模板强行加入不相关的“方法论区”“对比区”“金句区”。

画面左上角加入腾讯云 logo,logo 要清晰、简洁、位于左上角品牌区,不能变形,不能模糊。整体采用克制的腾讯云科技蓝、白色、浅蓝、深蓝作为主色,少量蓝紫渐变只用于强调关键词。风格高级、可信、适合企业客户朋友圈分享。不要五颜六色,不要花花绿绿,不要彩虹渐变,不要大面积黄/橙/红/绿。

标题要手机上一眼能看清,核心关键词可用蓝紫渐变大字突出。根据内容选择是否加入蓝色圆角横幅、SaaS 控制台面板、能力卡片、流程箭头、方法论卡片、对比卡片、数据看板、金句收尾、深蓝品牌栏等元素;只使用对当前内容有帮助的元素。

可加入 Q 版腾讯企鹅形象:圆润可爱,蓝白科技感,可戴工程师安全帽或架构师耳麦,手持平板电脑或任务板,像“前沿部署工程师”或“AI 转型顾问”,专业、亲和、可信;不要写实动物,不要普通卡通,要 Q 版企业科技 IP 感。企鹅和 WorkBuddy 形象只能辅助内容,不要抢占全部画面,不要遮挡文字。

如果出现产品/方案能力模块,做成现代 SaaS 控制台或圆角卡片,每个模块包含“模块名 + 2-3 个短能力点”,图标清晰、信息层级明确。如果出现方法论路径,卡片之间用箭头连接;如使用“企业 AI 进化路径”,默认路径可为:知识底座 → 超级个体 → 数字员工 → 超级组织,注意第二层必须是“超级个体”,不要写成“执行中枢”。

设计要求:竖屏 9:16;内容密度参考专业企业信息图长图;不是极简海报;但文字必须清楚可读;大标题清晰;关键信息用卡片承载;每个卡片文字不要太多;图标简洁;版式分区清晰;有商业方案感;有腾讯云科技感;有 WorkBuddy 产品感;适合朋友圈分享;白色和浅蓝背景为主;深蓝标题;蓝紫渐变只做少量强调;轻 3D 插画结合 SaaS UI 面板;不要复杂办公室大场景抢占文字;不要让插画压过内容;不要把文字做得太小;底部或品牌栏加入作者署名“任准(marcusren)”。

如果用户明确提供并要求使用参考图,写 prompt 时加一句:「整体视觉风格、配色和信息密度优先参考用户输入图,但只参考风格,不照搬排版;必须保留腾讯云 logo 与 Q版企鹅形象;版式必须严格根据用户内容重新规划,不要照搬参考图的模块数量与排列。」然后才把用户参考图通过 --reference 传给脚本。

把最终 prompt 写入 /tmp/infographic_prompt.txt长度 900-2200 字最佳;低于 700 字通常会显得空、low。

Step 4:调脚本出图

# 加载环境变量(sandbox 不自动 source shell 配置)
source ~/.zshrc 2>/dev/null

python3 "$HOME/.workbuddy/skills/infographic-generator/scripts/gen_infographic.py" \
  --prompt-file /tmp/infographic_prompt.txt \
  --quality medium \
  --aspect 9:16 \
  --resolution 2K \
  --count 1 \
  --negative-prompt "不要极简到只有三句话, 不要内容太空, 不要固定套版式, 不要不看内容强行加入方法论区或VS区, 不要复杂办公室大场景, 不要文字很小, 不要密密麻麻的小字, 不要乱码中文, 不要错别字, 不要文字变形, 不要腾讯云 logo 变形, 不要假 logo, 不要过多无关品牌标识, 不要横屏, 不要 1:1, 不要 16:9, 不要暗黑风, 不要过度赛博朋克, 不要游戏海报风, 不要廉价 PPT 风, 不要五颜六色, 不要花花绿绿, 不要彩虹渐变, 不要大面积黄橙红绿, 不要过度拥挤, 不要信息堆成一团, 不要插画遮挡文字, 不要让企鹅和 WorkBuddy 抢占全部画面, 不要写实企鹅, 不要恐怖机器人, 不要把第二层写成执行中枢"

可选参数:

参数默认备选说明
------------
--qualitymediumlow/high默认 medium;若小字糊或交付级要求更高,再升 high
--aspect9:16仅当用户明确要求才改:1:1 16:9 3:4 4:3默认 9:16 竖版,跟蓝图保持一致
--resolution2K1K 4K默认 2K;快速草稿可降 1K,印刷/大屏可升 4K
--count11-8OG 模型最多 8 张
--reference多次传,最多 16 次仅当用户明确提供并要求使用参考图时传入;本地路径会自动上传 VOD
--no-referenceflag强制纯文生图
--size2000x1104自定义尺寸(16 倍数 / 65w-829w 像素)
--formatpngjpeg输出格式
--negative-prompt文本不要出现的元素
--enhance-promptflag让服务端自动改写 prompt(一般关闭)
--seed整数复现用
--transparentflag透明背景(OG 不支持,会忽略)

脚本会:1) 提交任务 → 拿到 TaskId;2) 每 6 秒轮询 DescribeTaskDetail;3) 状态变 FINISH 时从 AigcImageTask.Output.FileInfos[].FileUrl 取永久 URL;4) 打印到 stdout。

Step 5:交付 + 迭代

  • 把图片 URL 直接发给用户(markdown 图片语法预览)
  • 必要时 curl 下载到本地后用 deliver_attachments 下发
  • 交付前必须做目检:腾讯云 logo 是否出现且文字无错;Q版企鹅是否出现;画面是否接近蓝白科技高密度拼贴风;是否有参考图截图残留或乱码。
  • 不满意就改 prompt 重出,不要直接换模型;典型修法:
  • 文字糊 → 升 quality 到 high 或降文字密度
  • logo 缺失/拼错 → 在 prompt 首尾各强调一次“左上角必须有清晰腾讯云 logo,文字仅写腾讯云 / Tencent Cloud,不能拼错”
  • Q版企鹅缺失 → 把企鹅设为“主体角色/主视觉锚点”,而不是背景装饰
  • 模块塞太多 → 砍模块、加留白
  • 画面显得 low/太空 → 先根据内容增加有效信息模块(能力矩阵、产品面板、流程路径、对比、数据看板、案例卡、金句等择需使用),不要固定套全量结构;补充“专业 SaaS 产品宣传长图、商业方案感、适合企业客户朋友圈分享”
  • 模型自己加戏加错文案 → 把每段文字用引号包起来 + 加 --negative-prompt "拼写错误, 错别字, 多余文案"

依赖

source ~/.zshrc 2>/dev/null
python3 -m pip install -q \
    tencentcloud-sdk-python-vod requests cos-python-sdk-v5

环境变量:TENCENTCLOUD_SECRET_ID / TENCENTCLOUD_SECRET_KEY(通过 source ~/.zshrc 自动加载,无需手动 export)

关键参考

  • references/prompt-cookbook.md:8 套工业级模板(来自 awesome-gpt-image-2,CC BY 4.0),含信息图、海报、科普、UI、知识卡片等
  • references/api-reference.md:腾讯云 VOD CreateAigcImageTask 的全部字段(含 ModelName/Version 矩阵、ExtInfo、PersonGeneration、合规参数等),脚本之外手写 API 调用时查这里

常见坑

  • 不要把参考图当版式模板:用户给的参考图只用来对齐"风格语言+信息密度",模块数和顺序必须按内容重新设计。
  • GPT-Image2 OG 不支持透明背景:要透明就降级到 gpt-image-1.5 或换 Hunyuan / Qwen。
  • 任务返回字段路径AigcImageTask.Output.FileInfos[].FileUrl不是 MediaInfoSet/MediaUrl
  • 永久存储 vs 临时:默认 Permanent(不会过期);临时存储 7 天会回收。
  • SubAppId 不通用:默认 0 使用主应用;如果账号使用 VOD 子应用且报 invalid vod user,从 VOD 控制台查自己的子应用 ID,并通过 --subapp-idTENCENTCLOUD_VOD_SUBAPP_ID 指定。
  • 并发限制:GPT-Image2 OG 默认 1 并发,前一个任务 PROCESSING 时再提交会报 RequestLimitExceeded: GenerateImage task reached the maximum concurrency(ErrCode 70000)。必须等前一个任务 FINISH 后再提交。并发出多张图请用 --count 一次出多张,不要并行起多个任务。如果踩到并发限制,等待 60-90 秒后重试。
  • 政治/真人风险:信息图常被对外公开,不要画领导人、政治符号、敏感地名;需要人物时优先卡通 IP 或剪影。
  • 货币:金融场景标注的"涨红跌绿"是中国惯例,US 用户场景会反过来。
  • 企鹅 IP:腾讯云企鹅仅限内部演示,对外商用请换通用吉祥物。

版本历史

共 1 个版本

  • v1.0.0 Initial release 当前
    2026-06-02 20:16 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Openai Whisper

steipete
使用 Whisper CLI 进行本地语音转文字(无需 API 密钥)
★ 333 📥 94,450
ai-agent

workbuddy客户拜访指北

user_463e8e26
输入企业名称+拜访对象,自动调研企业信息(公开信息+招聘画像),围绕拜访人关注点设计 AI Agent 业务场景方案,生成面向客户的专业 PDF 方案,输出一份简要现场沟通谈参(含贴合方案的现场演示编排),并通过 subagent 自动产出
★ 2 📥 119
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 224 📥 48,488