一站式多媒体处理技能,覆盖图片、PPT、音频、视频、AI创意五大场景,无需专业软件也能快速出图出视频。
前置条件: 需要 Python 环境,部分功能需用 pip install 安装依赖(见下方表格)。首次使用建议先跑 --example 查看命令效果。
适用人群: 办公人员(PPT/图片处理)、自媒体创作者(封面/字幕/配图)、短视频剪辑者(格式转换/调速)、普通用户(证件照/压缩/转文字)。不需要专业设计或编程背景,按文档复制命令即可运行。
适用场景: 日常办公美化、社交媒体配图、视频内容生产、活动海报设计、会议录音整理。不适合专业级印刷输出、影视级视频剪辑、商业级人像精修。
无需阅读全文,从最常用的几个场景开始:
| 你想做什么 | 一条命令搞定 |
|---|---|
| ----------- | ------------- |
| 图片转格式 | python scripts/image_batch.py --input ./照片 --convert --format jpg |
| 批量压缩 | python scripts/image_batch.py --input ./照片 --compress --quality 80 |
| 统一尺寸 | python scripts/image_batch.py --input ./照片 --resize 800x600 |
| 加水印 | python scripts/image_batch.py --input ./照片 --watermark "© 我的品牌" |
| 抠图换底 | python scripts/image_batch.py --input ./照片 --remove-bg --bg-color blue |
| PPT问题扫描 | python scripts/ppt_beautify.py check 汇报.pptx |
| PPT一键美化 | python scripts/ppt_beautify.py beautify 汇报.pptx --style 科技 -o 美化版.pptx |
| 配色方案 | python scripts/ppt_beautify.py palette --style 国风 |
| 音频转文字 | python scripts/audio_tools.py transcribe 录音.mp3 |
| 加字幕 | python scripts/audio_tools.py subtitle 视频.mp4 |
| 视频调速 | python scripts/audio_tools.py speed 视频.mp4 --factor 2.0 |
| 格式转换 | python scripts/audio_tools.py convert 视频.avi --format mp4 |
| 海报排版 | python scripts/poster_layout.py --title "春季促销" --style 促销 |
| AI绘图提示词 | python scripts/poster_layout.py --title "国风山水" --style 国风 --prompt-zh |
> 每条命令都支持 --example 参数查看详细用法和输出效果。遇到报错先读提示信息,缺少依赖会指导你安装。
你可以这样描述需求来唤起对应功能:
| 你想做什么 | 可以这样说 |
|---|---|
| ----------- | ----------- |
| 批量处理图片 | "帮我把这20张图转成WebP格式" / "把这些照片统一裁剪成800×600" |
| 加水印 | "给这批商品图批量加上logo水印" / "在图片右下角加版权文字" |
| 抠图换底色 | "把这张证件照换成白底" / "把照片背景去掉" |
| 压缩图片 | "把这批图压缩一下,保持画质" / "图片太大了帮我缩小" |
| PPT美化 | "帮我美化这个PPT,统一字体和配色" / "这个PPT太丑了翻新一下" |
| 配色方案 | "给这份汇报配个商务风格的配色方案" |
| 海报排版 | "帮我排版这段海报文案" / "设计一个活动海报" |
| 语音转文字 | "把这段录音转成文字稿" / "提取会议录音的文字" |
| 视频剪辑 | "剪掉视频开头和结尾的空白" / "把这个MOV转成MP4" |
| 加字幕 | "给这段视频加上中文字幕" |
| 音频处理 | "合并这几段音频" / "把音频加速到1.5倍" |
| AI绘图提示词 | "帮我写一段生成国风水墨画的提示词" / "用中文出图提示词" |
| 封面设计 | "设计一个科技感的海报封面" |
多媒体设计全能助手
├── 图片批量处理(格式转换/压缩/裁剪/抠图/水印/修图)
├── PPT&海报美化(版式规整/配色推荐/文案排版/素材匹配)
├── 音视频剪辑(音频转文字/剪辑/字幕/格式转换)
└── AI创意辅助(绘图提示词/配图生成/封面设计)
pip install Pillow opencv-python-headless pydub moviepy
pip install SpeechRecognition pyaudio pytesseract
pip install matplotlib numpy
| 任务 | 参考文档 | 推荐脚本 |
|---|---|---|
| ------ | --------- | --------- |
| 图片批量转换/压缩 | references/image-processing.md | scripts/image_batch.py --convert --compress |
| 图片裁剪/调整尺寸 | references/image-processing.md | scripts/image_batch.py --resize |
| 背景抠图/换底色 | references/image-processing.md | scripts/image_batch.py --remove-bg |
| 加水印 | references/image-processing.md | scripts/image_batch.py --watermark |
| 修图调整 | references/image-processing.md | scripts/image_batch.py --adjust |
| PPT问题扫描 | references/ppt-design.md | scripts/ppt_beautify.py check |
| PPT一键美化 | references/ppt-design.md | scripts/ppt_beautify.py beautify |
| 配色方案推荐 | references/ppt-design.md | scripts/ppt_beautify.py palette |
| 字体检查 | references/ppt-design.md | scripts/ppt_beautify.py fontcheck |
| 海报文案排版 | references/ppt-design.md | scripts/poster_layout.py |
| 翻新设计方案 | references/ppt-design.md | scripts/ppt_beautify.py template |
| 音频转文字 | references/audio-video.md | scripts/audio_tools.py transcribe |
| 音频/视频裁剪 | references/audio-video.md | scripts/audio_tools.py trim |
| 音视频拼接 | references/audio-video.md | scripts/audio_tools.py concat |
| 自动字幕生成 | references/audio-video.md | scripts/audio_tools.py subtitle |
| 格式转换 | references/audio-video.md | scripts/audio_tools.py convert |
| 音视频变速 | references/audio-video.md | scripts/audio_tools.py speed |
| 查看媒体信息 | references/audio-video.md | scripts/audio_tools.py info |
| 绘图提示词优化 | references/ai-creative.md | — |
| AI配图描述生成 | references/ai-creative.md | scripts/poster_layout.py --prompt |
| 封面设计排版 | references/ai-creative.md | scripts/poster_layout.py --cover |
| FAQ / 避坑指南 | references/faq.md | 常见问题与依赖安装指南 |
scripts/image_batch.py)| 参数 | 说明 | 默认值 |
|---|---|---|
| ------ | ------ | -------- |
--input / -i | 输入文件夹 | 必填 |
--output / -o | 输出文件夹 | ./output |
--convert | 启用格式转换 | — |
--format | 目标格式 | png |
--quality | 压缩质量 1-100 | 85 |
--resize | 调整尺寸,如 800x600 | — |
--resize-mode | 模式: fit(留白)/crop(裁剪)/stretch(拉伸) | fit |
--watermark | 水印文字 | — |
--opacity | 水印透明度 0-1 | 0.5 |
--position | 位置: 右下角/左上角/居中/平铺 | 右下角 |
--adjust | 启用修图调整 | — |
--brightness | 亮度 0.5-1.5 | 1.0 |
--contrast | 对比度 0.5-1.5 | 1.0 |
--saturation | 饱和度 0-2 | 1.0 |
--sharpen | 锐化 0-5 | 2 |
--compress | 启用批量压缩 | — |
--remove-bg | 启用抠图换底色 | — |
--bg-color | 底色: white/red/blue/transparent | white |
--example | 查看使用示例 | — |
scripts/audio_tools.py)| 子命令 | 参数 | 说明 | 默认值 |
|---|---|---|---|
| -------- | ------ | ------ | -------- |
transcribe | file | 音频文件路径 | 必填 |
--language | 语言 (zh-CN/en/ja/ko) | zh-CN | |
--engine | 引擎: auto/google/vosk | auto | |
--timeout | 网络超时秒数(0=不限) | 10 | |
--output / -o | 输出文稿路径 | — | |
trim | file | 文件路径 | 必填 |
--start | 开始时间 00:01:30 | — | |
--end | 结束时间 00:02:45 | — | |
--output / -o | 输出路径 | — | |
concat | --files | 多个文件 (至少2个) | 必填 |
--output / -o | 合并后文件路径 | — | |
subtitle | file | 音视频文件 | 必填 |
--language | 语言 | zh-CN | |
--engine | 引擎: auto/google/vosk | auto | |
--timeout | 网络超时秒数 | 10 | |
--chunk-sec | 分段秒数 (越小越精确) | 10 | |
--embed | 嵌入字幕到视频 | — | |
--output / -o | 输出的 SRT 路径 | — | |
convert | file | 源文件 | 必填 |
--format | 目标格式 | mp4 | |
--bitrate | 码率 | 2000k | |
--output / -o | 输出路径 | — | |
info | file | 文件路径 | 必填 |
speed | file | 音视频文件 | 必填 |
--factor / -f | 变速倍数:2.0=2倍速, 0.5=半速 | 必填 | |
--output / -o | 输出路径 | — | |
--example | 全局参数 | 查看使用示例 | — |
scripts/ppt_beautify.py)| 子命令 | 参数 | 说明 | 默认值 |
|---|---|---|---|
| -------- | ------ | ------ | -------- |
check | file | PPT 文件路径 | 必填 |
beautify | file | PPT 文件路径 | 必填 |
--style / -s | 风格: 商务/清新/科技/国风/简约/温暖 | 商务 | |
--output / -o | 输出路径 | — | |
palette | --style / -s | 指定风格(不指定则显示全部) | — |
fontcheck | file | PPT 文件路径 | 必填 |
template | --style / -s | 风格 | 商务 |
--cover | 封面标题 | — | |
--output / -o | 输出到文件 | — | |
--example | 全局参数 | 查看使用示例 | — |
scripts/poster_layout.py)| 参数 | 说明 | 默认值 |
|---|---|---|
| ------ | ------ | -------- |
--title | 主标题 | 必填 |
--subtitle | 副标题 | — |
--content | 内容要点列表(多个用空格分隔) | — |
--style | 风格: 商务/促销/清新/国风/科技/简约 | 商务 |
--cover | 封面模式(生成版式而非海报) | — |
--prompt | AI 绘图提示词(英文) | — |
--prompt-zh | AI 绘图提示词(中文) | — |
--output / -o | 保存到文件 | — |
--example | 查看使用示例 | — |
| 场景 | 限制 | 建议 |
|---|---|---|
| ------ | ------ | ------ |
| 抠图换底色 | 仅纯色背景,复杂背景效果差 | 专业抠图用 remove.bg / PhotoShop |
| 音频转文字 | 需要网络(Google API),国内网络受限 | 用 --engine vosk 离线识别 |
| 音频转文字 | 单文件建议 30 分钟内,过长可能超时 | 可先用音频软件分割再识别 |
| 字幕生成 | 网络依赖,10分钟视频约需 5-10 分钟 | 减小 --chunk-sec 提高精度但更慢 |
| 视频剪辑 | 需要安装 ffmpeg 或 moviepy | pip install moviepy + 安装 ffmpeg |
| 批量图片 | 单次建议不超过 100 张 | 可分批次执行 |
| 图片 CMYK | 不支持 CMYK 色彩模式转换 | 先转 RGB |
| PPT 美化 | 不修改原文件,需 --output 保存为新文件 | — |
| 旋转角度 | 仅支持 90°/180°/270° 整数旋转 | — |
| 中文路径 | 部分旧版库可能不兼容 | 优先用英文命名文件和目录 |
> 完整版请参考 FAQ / 避坑指南
日常设计场景中用户通常要处理大量文件。优先实现批量处理,单张处理作为备选。
压缩和格式转换时默认保持高质量,仅在用户明确要求时减小体积。
尽量减少用户的参数选择,提供"智能默认值":
色彩搭配、字体选择、排版布局要符合基本设计规范。输出的设计结果应该是"可用"而非"丑陋但功能正确"。
核心能力:
使用场景:
> "帮我把这20张图转成WebP格式"
> "把这些照片统一裁剪成800×600"
> "给这批商品图批量加上logo水印"
> "把这张证件照换成白底"
核心能力:
使用场景:
> "帮我美化这个PPT,统一字体和配色"
> "给这份汇报配个商务风格的配色方案"
> "帮我排版这段海报文案"
> "这个PPT太丑了,翻新一下"
核心能力:
使用场景:
> "把这段录音转成文字稿"
> "剪掉视频开头和结尾的空白"
> "给这段视频加上中文字幕"
> "把这个MOV转成MP4"
> "把视频加速到2倍速"
核心能力:
使用场景:
> "帮我写一段生成国风水墨画的提示词"
> "给这篇文章配一张意境图"
> "设计一个科技感的海报封面"
共 6 个版本