Workipedia
输入主题,生成图文并茂的 HTML 维基页面。
工作流程
生成维基页面包含以下步骤:
- 搜索阶段 - 使用 WebSearch 搜索主题相关信息。
- 内容抓取 - 使用 WebFetch 深度抓取关键网页内容。
- 信息整合 - 提取关键事实、数据、历史等。
- 图片获取 - 必须优先从网页(官网、百科、搜索结果)直接引用图片 URL。
- 页面生成 - 使用 HTML 模板生成结构化的维基页面。
- 预览提供 - 使用
expose 工具暴露端口并提供预览链接。
搜索策略
第一步:广泛搜索
搜索词:[主题] + 定义/简介
搜索词:[主题] + 历史/发展
搜索词:[主题] + 特点/特征
第二步:深度搜索(根据主题类型)
| 主题类型 | 补充搜索方向 |
|---|
| --------- | ------------- |
| 人物 | 生平、成就、影响、著作 |
| 技术 | 原理、应用、发展历程、优缺点 |
| 地点 | 地理位置、历史、文化、旅游景点 |
| 事件 | 背景、过程、影响、后续 |
| 概念 | 定义、分类、应用场景、案例 |
第三步:图片来源(关键优先级)
必须严格遵守以下优先级:
- 直接引用:从搜索结果中提取可用图片 URL。
- Wikipedia/Wikimedia Commons 的开放图片。
- 官方网站(Official Website)的宣传图片。
- 权威百科(如百度百科、互动百科)的配图。
- 搜索结果中的高质量新闻配图。
- AI 生成:仅当无法找到任何相关且可用的网络图片时,才使用生图工具(如 nano-banana-pro)生成。
输出规范
1. 页面生成
使用技能(SKILL.md所在)目录下templates/wiki_template.html 作为基础模板。将整合的信息填充到模板中,生成一个完整的 HTML 文件。
2. 预览链接
生成 HTML 文件后,必须执行以下操作:
- 将 HTML 文件保存为
<项目根目录>/workipedia/[主题].html。 - 在该目录下启动一个简单的 HTTP 服务(如
python3 -m http.server 8080)。 - 使用环境中的web页面预览工具暴露 8080 端口。
- 向用户提供生成的预览链接。
图片处理准则
引用网页图片
从搜索结果中找到图片 URL 后:
- 验证来源:优先选择来自官网或百科的图片。
- 确保可访问性:确保图片 URL 是公开可访问的直链。
- 标注来源:在 HTML 页面中清晰标注图片来源。
- 如何解决无法获取图片的问题:
1)使用浏览器(agent-browser、chrome浏览器之类的)打开相关网页(如百度百科)的页面,或许可以获取图片链接
2)获得图片链接后,用wget或者curl下载到<项目根目录>/workipedia,再将图片路径嵌入到html中,严禁使用emoji占位符或者随机图片代替图片
> 注:只有需要解释流程或者特定架构比如软件流程、软件架构需要画图
示例流程
用户输入: 特斯拉 Model 3
执行步骤:
- 搜索 "特斯拉 Model 3 官网"、"Tesla Model 3 Wikipedia"、"Model 3 参数"。
- 抓取官网和维基百科内容。
- 获取图片:通过agent browser从特斯拉官网获取 Model 3 的官方渲染图 URL,并使用wget或者curl下载到本地
- 生成 HTML:填充模板,包含参数表、历史、特点等。
- 提供预览:启动服务并调用
expose,返回类似 https://xxxx.<你的预览服务域名>/特斯拉_Model_3.html 的链接。
注意事项
- HTML 优先:不再输出 Markdown 文件,必须输出完整的 HTML。
- 图片真实性:百科类内容应尽可能使用真实图片而非 AI 生成图。
- 链接有效性:确保提供的预览链接在任务结束前有效。
- 中立客观:保持百科式叙述风格。