← 返回
未分类

Multimedia Processing Toolkit

多媒体图文设计全能助手 — 集成图片批量处理(格式转换/压缩/裁剪/抠图/水印)、PPT智能美化(版式规整/配色优化/素材匹配)、音视频简易处理(音频转文字/剪辑拼接/字幕生成/格式转换)、AI创意生成辅助(绘图提示词优化/配图生成/封面设计)。适用于办公汇报、自媒体配图、短视频剪辑、证件照片处理、海报设计等场景。当用户提到修图、抠图、PPT美化、视频剪辑、加字幕、音频转文字、批量处理图片、海报设计、换底色、加水印、AI绘图提示词等内容时,必须启用此技能。即使只提到"美化""排版""批处理""设计"等关键词也应触发。
>-
jm-jsjkxyjs02-clh-161
未分类 community v1.0.5 6 版本 100000 Key: 无需
★ 1
Stars
📥 83
下载
💾 0
安装
6
版本
#latest

概述

多媒体图文设计全能助手

一站式多媒体处理技能,覆盖图片、PPT、音频、视频、AI创意五大场景,无需专业软件也能快速出图出视频。

前置条件: 需要 Python 环境,部分功能需用 pip install 安装依赖(见下方表格)。首次使用建议先跑 --example 查看命令效果。

适用人群: 办公人员(PPT/图片处理)、自媒体创作者(封面/字幕/配图)、短视频剪辑者(格式转换/调速)、普通用户(证件照/压缩/转文字)。不需要专业设计或编程背景,按文档复制命令即可运行。

适用场景: 日常办公美化、社交媒体配图、视频内容生产、活动海报设计、会议录音整理。不适合专业级印刷输出、影视级视频剪辑、商业级人像精修。


快速上手

无需阅读全文,从最常用的几个场景开始:

你想做什么一条命令搞定
------------------------
图片转格式python scripts/image_batch.py --input ./照片 --convert --format jpg
批量压缩python scripts/image_batch.py --input ./照片 --compress --quality 80
统一尺寸python scripts/image_batch.py --input ./照片 --resize 800x600
加水印python scripts/image_batch.py --input ./照片 --watermark "© 我的品牌"
抠图换底python scripts/image_batch.py --input ./照片 --remove-bg --bg-color blue
PPT问题扫描python scripts/ppt_beautify.py check 汇报.pptx
PPT一键美化python scripts/ppt_beautify.py beautify 汇报.pptx --style 科技 -o 美化版.pptx
配色方案python scripts/ppt_beautify.py palette --style 国风
音频转文字python scripts/audio_tools.py transcribe 录音.mp3
加字幕python scripts/audio_tools.py subtitle 视频.mp4
视频调速python scripts/audio_tools.py speed 视频.mp4 --factor 2.0
格式转换python scripts/audio_tools.py convert 视频.avi --format mp4
海报排版python scripts/poster_layout.py --title "春季促销" --style 促销
AI绘图提示词python scripts/poster_layout.py --title "国风山水" --style 国风 --prompt-zh

> 每条命令都支持 --example 参数查看详细用法和输出效果。遇到报错先读提示信息,缺少依赖会指导你安装。


用户对话示例

你可以这样描述需求来唤起对应功能:

你想做什么可以这样说
----------------------
批量处理图片"帮我把这20张图转成WebP格式" / "把这些照片统一裁剪成800×600"
加水印"给这批商品图批量加上logo水印" / "在图片右下角加版权文字"
抠图换底色"把这张证件照换成白底" / "把照片背景去掉"
压缩图片"把这批图压缩一下,保持画质" / "图片太大了帮我缩小"
PPT美化"帮我美化这个PPT,统一字体和配色" / "这个PPT太丑了翻新一下"
配色方案"给这份汇报配个商务风格的配色方案"
海报排版"帮我排版这段海报文案" / "设计一个活动海报"
语音转文字"把这段录音转成文字稿" / "提取会议录音的文字"
视频剪辑"剪掉视频开头和结尾的空白" / "把这个MOV转成MP4"
加字幕"给这段视频加上中文字幕"
音频处理"合并这几段音频" / "把音频加速到1.5倍"
AI绘图提示词"帮我写一段生成国风水墨画的提示词" / "用中文出图提示词"
封面设计"设计一个科技感的海报封面"

技能架构

多媒体设计全能助手
├── 图片批量处理(格式转换/压缩/裁剪/抠图/水印/修图)
├── PPT&海报美化(版式规整/配色推荐/文案排版/素材匹配)
├── 音视频剪辑(音频转文字/剪辑/字幕/格式转换)
└── AI创意辅助(绘图提示词/配图生成/封面设计)

依赖安装

pip install Pillow opencv-python-headless pydub moviepy
pip install SpeechRecognition pyaudio pytesseract
pip install matplotlib numpy

快速参考

任务参考文档推荐脚本
------------------------
图片批量转换/压缩references/image-processing.mdscripts/image_batch.py --convert --compress
图片裁剪/调整尺寸references/image-processing.mdscripts/image_batch.py --resize
背景抠图/换底色references/image-processing.mdscripts/image_batch.py --remove-bg
加水印references/image-processing.mdscripts/image_batch.py --watermark
修图调整references/image-processing.mdscripts/image_batch.py --adjust
PPT问题扫描references/ppt-design.mdscripts/ppt_beautify.py check
PPT一键美化references/ppt-design.mdscripts/ppt_beautify.py beautify
配色方案推荐references/ppt-design.mdscripts/ppt_beautify.py palette
字体检查references/ppt-design.mdscripts/ppt_beautify.py fontcheck
海报文案排版references/ppt-design.mdscripts/poster_layout.py
翻新设计方案references/ppt-design.mdscripts/ppt_beautify.py template
音频转文字references/audio-video.mdscripts/audio_tools.py transcribe
音频/视频裁剪references/audio-video.mdscripts/audio_tools.py trim
音视频拼接references/audio-video.mdscripts/audio_tools.py concat
自动字幕生成references/audio-video.mdscripts/audio_tools.py subtitle
格式转换references/audio-video.mdscripts/audio_tools.py convert
音视频变速references/audio-video.mdscripts/audio_tools.py speed
查看媒体信息references/audio-video.mdscripts/audio_tools.py info
绘图提示词优化references/ai-creative.md
AI配图描述生成references/ai-creative.mdscripts/poster_layout.py --prompt
封面设计排版references/ai-creative.mdscripts/poster_layout.py --cover
FAQ / 避坑指南references/faq.md常见问题与依赖安装指南

参数速查

图片处理 (scripts/image_batch.py)

参数说明默认值
--------------------
--input / -i输入文件夹必填
--output / -o输出文件夹./output
--convert启用格式转换
--format目标格式png
--quality压缩质量 1-10085
--resize调整尺寸,如 800x600
--resize-mode模式: fit(留白)/crop(裁剪)/stretch(拉伸)fit
--watermark水印文字
--opacity水印透明度 0-10.5
--position位置: 右下角/左上角/居中/平铺右下角
--adjust启用修图调整
--brightness亮度 0.5-1.51.0
--contrast对比度 0.5-1.51.0
--saturation饱和度 0-21.0
--sharpen锐化 0-52
--compress启用批量压缩
--remove-bg启用抠图换底色
--bg-color底色: white/red/blue/transparentwhite
--example查看使用示例

音视频处理 (scripts/audio_tools.py)

子命令参数说明默认值
----------------------------
transcribefile音频文件路径必填
--language语言 (zh-CN/en/ja/ko)zh-CN
--engine引擎: auto/google/voskauto
--timeout网络超时秒数(0=不限)10
--output / -o输出文稿路径
trimfile文件路径必填
--start开始时间 00:01:30
--end结束时间 00:02:45
--output / -o输出路径
concat--files多个文件 (至少2个)必填
--output / -o合并后文件路径
subtitlefile音视频文件必填
--language语言zh-CN
--engine引擎: auto/google/voskauto
--timeout网络超时秒数10
--chunk-sec分段秒数 (越小越精确)10
--embed嵌入字幕到视频
--output / -o输出的 SRT 路径
convertfile源文件必填
--format目标格式mp4
--bitrate码率2000k
--output / -o输出路径
infofile文件路径必填
speedfile音视频文件必填
--factor / -f变速倍数:2.0=2倍速, 0.5=半速必填
--output / -o输出路径
--example全局参数查看使用示例

PPT 美化 (scripts/ppt_beautify.py)

子命令参数说明默认值
----------------------------
checkfilePPT 文件路径必填
beautifyfilePPT 文件路径必填
--style / -s风格: 商务/清新/科技/国风/简约/温暖商务
--output / -o输出路径
palette--style / -s指定风格(不指定则显示全部)
fontcheckfilePPT 文件路径必填
template--style / -s风格商务
--cover封面标题
--output / -o输出到文件
--example全局参数查看使用示例

海报排版 (scripts/poster_layout.py)

参数说明默认值
--------------------
--title主标题必填
--subtitle副标题
--content内容要点列表(多个用空格分隔)
--style风格: 商务/促销/清新/国风/科技/简约商务
--cover封面模式(生成版式而非海报)
--promptAI 绘图提示词(英文)
--prompt-zhAI 绘图提示词(中文)
--output / -o保存到文件
--example查看使用示例

已知限制

场景限制建议
------------------
抠图换底色仅纯色背景,复杂背景效果差专业抠图用 remove.bg / PhotoShop
音频转文字需要网络(Google API),国内网络受限--engine vosk 离线识别
音频转文字单文件建议 30 分钟内,过长可能超时可先用音频软件分割再识别
字幕生成网络依赖,10分钟视频约需 5-10 分钟减小 --chunk-sec 提高精度但更慢
视频剪辑需要安装 ffmpeg 或 moviepypip install moviepy + 安装 ffmpeg
批量图片单次建议不超过 100 张可分批次执行
图片 CMYK不支持 CMYK 色彩模式转换先转 RGB
PPT 美化不修改原文件,需 --output 保存为新文件
旋转角度仅支持 90°/180°/270° 整数旋转
中文路径部分旧版库可能不兼容优先用英文命名文件和目录

> 完整版请参考 FAQ / 避坑指南


设计原则

1. 批量优先

日常设计场景中用户通常要处理大量文件。优先实现批量处理,单张处理作为备选。

2. 保持画质

压缩和格式转换时默认保持高质量,仅在用户明确要求时减小体积。

3. 一键出活

尽量减少用户的参数选择,提供"智能默认值":

  • 压缩质量默认 85(平衡画质和体积)
  • 字体默认 思源黑体/PingFang(中文字体兼容性最好)
  • 配色默认商务蓝灰(适用范围最广)

4. 审美在线

色彩搭配、字体选择、排版布局要符合基本设计规范。输出的设计结果应该是"可用"而非"丑陋但功能正确"。


模块详解

图片处理

核心能力:

  • 格式互转:JPG↔PNG↔WebP↔BMP↔TIFF
  • 批量压缩:控制质量/尺寸,批量减小体积
  • 裁剪旋转:统一尺寸、批量裁剪、旋转校正
  • 基础修图:亮度/对比度/饱和度/模糊/锐化
  • 水印操作:文字水印、图片水印、批量添加/去除
  • 背景处理:一键抠图、证件照换底色

使用场景:

> "帮我把这20张图转成WebP格式"

> "把这些照片统一裁剪成800×600"

> "给这批商品图批量加上logo水印"

> "把这张证件照换成白底"

PPT&海报美化

核心能力:

  • 版式规整:统一字体、字号、行距、配色
  • 配色推荐:商务、清新、国风、简约、科技风格
  • 文案排版:标题/副标题/正文层级划分、居中对齐
  • 旧稿翻新:老旧PPT一键提升设计感
  • 海报布局:快速生成活动海报、封面图

使用场景:

> "帮我美化这个PPT,统一字体和配色"

> "给这份汇报配个商务风格的配色方案"

> "帮我排版这段海报文案"

> "这个PPT太丑了,翻新一下"

音视频处理

核心能力:

  • 音频转文字:会议录音、采访语音转文稿(含自动重试,网络不稳定自动恢复)
  • 音频编辑:裁剪、拼接、音量标准化
  • 视频剪辑:片段截取、多段合并、倍速调整
  • 字幕生成:为视频生成SRT字幕或硬字幕(含自动重试)
  • 格式转换:MP4/AVI/MOV/MP3/WAV互转

使用场景:

> "把这段录音转成文字稿"

> "剪掉视频开头和结尾的空白"

> "给这段视频加上中文字幕"

> "把这个MOV转成MP4"

> "把视频加速到2倍速"

AI创意辅助

核心能力:

  • 提示词优化:简单描述→专业AI绘图提示词
  • 配图匹配:根据文案推荐图片意境/风格
  • 封面设计:输入标题和风格,生成封面排版方案
  • 画风统一:批量调整AI生成图片的色调和尺寸

使用场景:

> "帮我写一段生成国风水墨画的提示词"

> "给这篇文章配一张意境图"

> "设计一个科技感的海报封面"


质量检查清单

  • [ ] 输出文件格式正确、可正常打开
  • [ ] 批量处理时所有文件均已处理(无遗漏)
  • [ ] 图片画质可接受(不过度压缩)
  • [ ] PPT字体、配色一致(不出现多种字体混搭)
  • [ ] 字幕时间轴与语音同步
  • [ ] 音频/视频无杂音、截断位置准确
  • [ ] 水印位置合理(不遮挡主要内容)
  • [ ] 裁剪后的图片主体完整
  • [ ] 临时文件已清理

版本历史

共 6 个版本

  • v1.0.5 Initial release 当前
    2026-05-23 14:19 安全 安全
  • v1.0.4 Initial release
    2026-05-23 14:05 安全
  • v1.0.3 Initial release
    2026-05-23 13:48 安全 安全
  • v1.0.2 Initial release
    2026-05-23 13:27 安全 安全
  • v1.0.1 Initial release
    2026-05-23 11:23 安全 安全
  • v1.0.0 Initial release
    2026-05-23 11:06 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

design-media

Nano Banana Pro

steipete
使用 Nano Banana Pro (Gemini 3 Pro Image) 生成或编辑图像。支持文生图、图生图及 1K/2K/4K 分辨率,适用于图像创建、修改及编辑请求,使用 --input-image 指定输入图像。
★ 430 📥 117,152
office-efficiency

office-pro-v5

user_b1a1dd34
★ 0 📥 138
design-media

UI/UX Pro Max

xobi667
提供 UI/UX 设计智能与实现指导,帮助打造精美界面。适用于 UI 设计、UX 流程、信息架构、视觉风格、设计系统/标记、组件规格、文案/微文案、无障碍及前端 UI(HTML/CSS/JS、React、Next.js、Vue、Svelte
★ 218 📥 47,899