← 返回
未分类

Story Video Generator

从图片或文字描述自动生成完整视频故事。支持灵活输入(1-N张图片/纯文字/混合),可选时长和风格。当用户要求生成视频故事、视频短片、图片转视频、文字转视频时使用。
根据图片或文字自动生成完整视频故事,支持1‑N张图片、纯文字或混合输入,可选时长和风格,适用于生成视频故事、短片、图片转视频或文字转视频。
zeng-austin zeng-austin 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 381
下载
💾 3
安装
1
版本
#latest

概述

故事视频生成助手

从用户提供的图片或文字描述自动生成完整的视频故事。完整流程:脚本生成 → 主体参考图 → 首帧图片 → 视频片段 → 背景音乐 → 最终合成。

快速开始

输入要求

  • 图片模式:1-N 张图片(不强制分类,AI 自动识别)
  • 文字模式:纯文字描述故事
  • 混合模式:图片 + 文字补充

可选参数

  • 时长:24秒(4段)/ 48秒(默认,8段)/ 72秒(12段)
  • 风格(纯文字时):吉卜力 / 赛博朋克 / 写实 / 水彩 / 像素 / 动漫 / 油画 / 极简 / AI推荐

输出格式

生成视频后用以下格式输出:

<deliver_assets>
<item>
<path>视频路径</path>
</item>
</deliver_assets>

执行流程

Step 0: 环境检查

  1. 检查 FFmpeg 是否可用,不可用则安装
  2. 接收用户输入(图片/文字)
  3. 确定时长(未指定默认 48 秒)
  4. 纯文字时确定风格(未指定则 AI 推荐)

Step 1: 生成故事脚本

  • 有图片 → 用 images_understand 分析图片,生成脚本
  • 纯文字 → 用 LLM 生成脚本
  • 输出:output/story_script.json

Step 1.5: 主体参考图生成

  • 基于 analysis.subject 生成主体参考图
  • 作为整个视频视觉一致性的锚点
  • 输出:output/subject_reference.png

Step 2: 首帧图片生成(串联)

  • 必须逐帧生成,每帧用主体参考图 + 上一帧作为双重参考
  • 禁止并行生成
  • 输出:output/frames/frame_01.png - frame_N.png

Step 3: 视频片段生成

  • 从首帧图片生成视频片段
  • 参数:duration=6秒,resolution=768P
  • 输出:output/videos/segment_01.mp4 - segment_N.mp4

Step 4: 背景音乐生成(可与 Step 3 并行)

  • 生成无歌词 BGM,时长等于视频总时长
  • 输出:output/bgm.mp3

Step 5: 视频拼接与音乐合成

  • 使用 FFmpeg 拼接视频片段并叠加 BGM
  • 输出:output/final_video.mp4

关键约束

参数
-----------
每段时长6秒(固定)
视频分辨率768P
背景音乐无歌词纯音乐

常用工具

工具用途
------------
images_understand分析图片生成脚本
gen_images生成首帧图片
gen_videos生成视频片段
gen_music生成背景音乐
exec + FFmpeg拼接视频与合成音频

常见错误

  1. 首帧并行生成 → 角色一致性无法保证
  2. 每段未重复主体特征 → 角色长相漂移
  3. BGM 带歌词 → 必须强调 instrumental, no vocals
  4. 跳过主体参考图 → 视觉一致性无法保证

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-03 10:00 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Video Frames

steipete
使用 ffmpeg 从视频中提取帧或短片。
★ 134 📥 52,949
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 218 📥 47,885
design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 430 📥 117,141