← 返回
AI智能 Key 中文

Bailian Studio

Call Aliyun Bailian via DashScope; support OCR, TTS, text-to-image and image-to-image.
通过DashScope调用阿里云百炼;支持OCR、TTS、文生图和图生图。
yab
AI智能 clawhub v0.2.0 3 版本 100000 Key: 需要
★ 0
Stars
📥 581
下载
💾 11
安装
3
版本
#latest

概述

Bailian Studio

Use DashScope for OCR、TTS、文生图、图生图。

Requirements

  • Python 3
  • dashscope (>=1.24.0)
  • oss2
  • requests
  • ffmpeg(TTS 播放依赖,使用 ffplay)

Install:

pip install -r requirements.txt

Config

API Key (priority order):

  1. DASHSCOPE_API_KEY env
  2. secrets/bailian.env

OSS (priority order):

  1. OSS_ACCESS_KEY, OSS_SECRET_KEY, OSS_BUCKET, OSS_ENDPOINT, OSS_REGION env
  2. secrets/bailian.env

Example secrets/bailian.env:

DASHSCOPE_API_KEY=sk-xxx
DASHSCOPE_BASE_URL=https://dashscope.aliyuncs.com/api/v1

# TTS 可选配置(留空走默认)
BAILIAN_TTS_MODEL=qwen3-tts-flash
BAILIAN_TTS_VOICE=
BAILIAN_TTS_SAMPLE_RATE=16000

OSS_ACCESS_KEY=ak-xxx
OSS_SECRET_KEY=sk-xxx
OSS_BUCKET=your-bucket
OSS_ENDPOINT=oss-cn-beijing.aliyuncs.com
OSS_REGION=cn-beijing

Defaults:

  • Region/base URL: Beijing (https://dashscope.aliyuncs.com/api/v1)
  • Image model: qwen-image-2.0-pro
  • Output dir: tmp/bailian-studio/
  • Output format: PNG

Usage

TTS (speak)

python3 {baseDir}/scripts/tts_speak.py --text "你好"

OCR (text)

From local image (uploads to OSS):

python3 {baseDir}/scripts/ocr_text.py --image /path/to.png

From URL:

python3 {baseDir}/scripts/ocr_text.py --url https://example.com/image.png

Image generate (text-to-image)

python3 {baseDir}/scripts/image_generate.py \
  --prompt "一只坐在云端的橘猫" \
  --width 1024 \
  --height 1024

Image generate (image-to-image)

Local image:

python3 {baseDir}/scripts/image_generate.py \
  --prompt "改成赛博朋克风格" \
  --image /path/to/reference.png \
  --width 1024 \
  --height 1024

URL image:

python3 {baseDir}/scripts/image_generate.py \
  --prompt "改成水彩插画风格" \
  --image https://example.com/reference.png \
  --width 1024 \
  --height 1024

stdin prompt

echo "一只会发光的鲸鱼漂浮在夜空" | python3 {baseDir}/scripts/image_generate.py

Behavior

  • 本地参考图:先上传 OSS,再传给 DashScope
  • URL 参考图:直接透传给 DashScope
  • 默认一次生成 1 张图
  • 成功后 stdout 打印保存路径
  • 若文件名已存在,自动重命名
  • 失败时输出错误信息并返回非 0 退出码

版本历史

共 3 个版本

  • v0.2.0 当前
    2026-05-01 10:48 安全 安全
  • v0.0.2
    2026-03-29 22:27 安全 安全
  • v0.0.1
    2026-03-14 03:18

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

ai-intelligence

Self-Improving + Proactive Agent

ivangdavila
自我反思+自我批评+自我学习+自组织记忆。智能体评估自身工作、发现错误并持续改进。
★ 1,358 📥 318,473
ai-intelligence

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 418 📥 115,240
ai-intelligence

ontology

oswalpalash
类型化知识图谱,用于结构化智能体记忆与可组合技能。支持创建/查询实体(人员、项目、任务、事件、文档)及关联...
★ 712 📥 243,883