从 Excel 客户列表出发,自动完成:
读取用户提供的 Excel 文件,提取公司英文名列(通常为 "Customer" 列)。同时读取中文名列(若已有)。
若 Excel 中已有中文名列,直接使用。若没有,对每家公司进行网络搜索,获取官方中文名。
确定中文名后,必须将结果写回用户的原始 Excel 文件,而不是只保存在中间 JSON 中。
操作步骤:
' vs 撇号 ')> ⚠️ 这一步是必须的,用户需要中文名留在原始表格中。
按以下标准将公司分为 4 个 Tier:
| Tier | 标准 |
|---|---|
| ------ | ------ |
| 1 | 全球知名企业:世界500强、行业绝对龙头(如台积电、摩根士丹利、国泰航空) |
| 2 | 行业领先:知名上市公司、区域一线品牌(如海信、三井住友、香港电讯) |
| 3 | 区域知名:有一定规模的上市/知名企业(如联影医疗、太古地产、德勤) |
| 4 | 其他客户:规模较小或知名度较低的企业 |
使用 scripts/download_logos.py 自动下载 Logo。
关键配置(根据你的环境修改):
/Applications/Google Chrome.app/Contents/MacOS/Google Chrome(或系统 Chrome 路径)<你的Node路径>/bin/node<你的Node路径>/workspace/node_modules> 💡 快速获取路径:which node 和 npm root -g
搜索策略(按优先级):
{公司中文名} {英文名} logo使用 scripts/normalize_logos.py 将所有下载的 Logo 统一为真正的 PNG 格式。
解决的问题:
.pngCould not process image转换策略(自动检测文件头):
| 实际格式 | 转换方式 |
|---|---|
| --------- | --------- |
| JPEG/WEBP | Pillow 转 RGBA → 保存 PNG |
| SVG | rsvg-convert → cairosvg → qlmanage(macOS)按优先级尝试 |
| 已是 PNG | 跳过,仅验证完整性 |
> ⚠️ build_ppt.py 也内置了运行时格式修复(ensure_real_png),但建议先跑一遍标准化脚本。
本步骤无需用户手动校对,使用 scripts/verify_logos.py 自动核验:
pytesseract 提取图片中的文字,检查是否包含公司名称关键词详见 references/logo-verification.md。
使用 scripts/build_ppt.py 生成 Logo 墙 PPT。
PPT 设计规范(详见 references/ppt-design.md):
# 设置环境变量(根据你的实际路径修改)
export NODE_PATH="<你的Node模块路径>"
export NODE_BIN="<你的Node可执行文件路径>"
export AGENT_BROWSER="<你的agent-browser路径>"
# 1. 下载 Logo(用 Node + playwright)
$NODE_BIN scripts/download_logos.js --output <输出目录> --companies <公司列表JSON>
# 2. Logo 格式标准化(确保全部是真正的 PNG)
python3 scripts/normalize_logos.py --logos-dir <logo目录> --companies <公司列表JSON>
# 3. 核验 Logo
python3 scripts/verify_logos.py --logos-dir <logo目录> --companies <公司列表JSON>
# 4. 生成 PPT
python3 scripts/build_ppt.py --logos-dir <logo目录> --companies <公司列表JSON> --output <输出路径>
| 脚本 | 作用 |
|---|---|
| ------ | ------ |
scripts/download_logos.js | 用 playwright + 百度/Bing 图片批量下载 Logo(Node.js) |
scripts/normalize_logos.py | Logo 格式标准化:JPEG/WEBP/SVG → 真正 PNG(Python) |
scripts/verify_logos.py | 自动核验 Logo 准确性(Python) |
scripts/build_ppt.py | 生成 Logo 墙 PPT,内置格式修复(Python + python-pptx) |
references/logo-verification.md:Logo 自动核验的详细逻辑与阈值说明references/ppt-design.md:PPT 设计规范与颜色定义references/logo-format-issues.md:Logo 格式常见问题与解决方案python-pptx, pillow, pytesseract(可选,用于 OCR 核验)/Applications/Google Chrome.app(供 playwright 使用)共 1 个版本