← 返回
未分类 Key

Multi-Modal Content Creator

End-to-end multimodal content creation workflow — receive WhatsApp requests (text or voice), transcribe audio via Whisper, generate images with DALL-E 3, and...
端到端多模态内容创作工作流 —接收 WhatsApp 文字或语音请求,使用 Whisper 转录音频,使用 DALL‑E 3 生成图片,并…
terrycarter1985 terrycarter1985 来源
未分类 clawhub v1.0.1 2 版本 100000 Key: 需要
★ 0
Stars
📥 335
下载
💾 0
安装
2
版本
#latest

概述

Multi-Modal Content Creator

Automated content creation workflow for freelance creators. Receives customer requests via WhatsApp (text or voice notes), transcribes audio to text, generates images from prompts, and sends results back.

Components

  • wacli.py — WhatsApp CLI client for receiving/sending messages
  • transcribe.py — Audio transcription via OpenAI Whisper API (handles large files by chunking)
  • generate_images.py — DALL-E 3 image generation with batch support
  • workflow.py — End-to-end orchestrator

Prerequisites

  • Python 3.10+
  • OpenAI API key (OPENAI_API_KEY env var)
  • WhatsApp CLI auth token

Setup

pip install -r requirements.txt
export OPENAI_API_KEY="your-api-key"
python wacli.py login <your-wacli-token>

Usage

Process all incoming WhatsApp requests

python workflow.py process-all

Generate a single image

python generate_images.py "a cat riding a skateboard"

Batch generate from file

python generate_images.py prompts.txt

Transcribe audio

python transcribe.py recording.mp3

WhatsApp CLI

python wacli.py list
python wacli.py send +1234567890 "Hello!"

版本历史

共 2 个版本

  • v1.0.1 当前
    2026-05-21 13:51 安全 安全
  • v1.0.0
    2026-05-08 13:50 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

content-creation

Humanizer

biostartechnology
消除AI写作痕迹,使文本更自然真实。基于维基百科"AI写作特征"指南,识别并修正夸张象征、宣传用语、肤浅-ing分析、模糊归因、破折号滥用、三项排比、AI词汇、负面平行结构及冗长连接词等模式。
★ 901 📥 205,686
dev-programming

Code Formatter

terrycarter1985
代码格式化最佳实践及常用语言(Python、JavaScript、JSON、Markdown 等)的快速参考,使用 Prettier、Black、ESLint 等工具。
★ 0 📥 790
content-creation

humanizer-zh

liuxy951129-cpu
去除文本中的 AI 生成痕迹。适用于编辑或审阅文本,使其听起来更自然、更像人类书写。 基于维基百科的"AI 写作特征"综合指南。检测并修复以下模式:夸大的象征意义、 宣传性语言、以 -ing 结尾的肤浅分析、模糊的归因、破折号过度使用、三段
★ 59 📥 29,078