OpenClaw AI 通用能力清单 (Skill Card)
> 本文档仅描述 AI Agent 的通用能力边界,不含任何用户个人数据或记忆。
1. 🧠 智能对话与推理
- 自然语言理解与生成(多语言支持)
- 逻辑推理、代码解读、技术方案设计
- 内容创作:文案、文档、PPT 大纲、邮件等
- 角色扮演与风格模拟(可指定输出风格)
- 结构化输出能力(表格、JSON、Markdown、Mermaid 等)
2. 📁 文件系统操作
| 能力 | 说明 |
|---|
| ------ | ------ |
read | 读取文本文件、图片(支持 jpg/png/gif/webp) |
write | 创建或覆写文件,自动创建父目录 |
edit | 精准文本替换编辑,支持多编辑合并 |
3. 💻 Shell 命令执行
- 执行任意 Shell 命令(
exec) - 支持后台运行、超时控制、环境变量注入
- 支持 PTY(伪终端)用于 TUI/交互式 CLI
- 进程管理:查看日志、发送输入、终止(
process)
4. 🌐 网络与浏览器
| 能力 | 说明 |
|---|
| ------ | ------ |
web_fetch | HTTP(S) 网页抓取,输出 Markdown/Text |
browser | 全功能浏览器自动化(基于 Playwright) |
浏览器能力包括:
- 页面导航、截图(全页/视口)、PDF 导出
- DOM 快照、元素交互(点击/输入/拖拽/选择)
- 表单填充、文件上传、对话框处理
- 支持 isolated 沙箱浏览器 或 host 用户浏览器(复用登录态)
- Console 日志采集
5. 📨 多平台消息发送
支持通过 message 工具向多种渠道发送消息:
- 企业微信(WeCom):文字、图片、文件、Markdown
- Telegram:支持图片/GIF/文件/语音、消息效果、引用回复
- Discord:频道消息、活动状态、贴纸
- Slack:频道/私信/线程消息
- 通用能力:@提及、回复、编辑、删除、Reaction
6. 🖼️ 媒体与附件
- 发送图片(自动识别格式,支持压缩控制)
- 发送文件/文档(
MEDIA: 指令) - 视频/语音消息(AMR 格式语音)
- Base64 buffer 直传
- 图片/GIF 可强制以文件形式发送避免压缩
7. 🎤 语音合成 (TTS)
- 文本转语音输出
- 自动适配渠道格式(如 Telegram 语音消息)
8. 🎨 可视化与 Canvas
- 渲染 HTML/JS 到虚拟画布
- 截图输出(PNG/JPG)
- 支持 A2UI(Agent-to-User Interface)组件推送
- 适用于数据可视化、UI 原型、动态图表
9. 🔗 企业微信深度集成
通过 wecom_mcp 调用企业微信 MCP Server:
- 通讯录 (contact):获取联系人信息
- 文档 (doc):操作企业微信文档
- 可扩展品类,按需调用
10. 🧩 多代理与子任务
| 能力 | 说明 |
|---|
| ------ | ------ |
sessions_spawn | 派生子代理执行独立任务(subagent/acp 运行时) |
sessions_send | 向已有会话注入任务并等待结果 |
subagents | 列出/终止/引导正在运行的子代理 |
sessions_list | 查看所有可见会话 |
适用场景:并行处理、长时间任务委派、跨会话协调。
11. 📚 上下文管理
memory_search / memory_get:搜索和读取记忆库tdai_memory_search:结构化长期记忆检索tdai_conversation_search:原始对话历史搜索scene_blocks:场景化记忆(按主题分块存储)
12. ⚙️ 其他特性
- 沙箱隔离:exec 和 browser 支持 sandbox 模式
- 超时控制:子任务、浏览器操作均可设超时
- 安全边界:文件/命令执行可配置 allowlist/denylist
- 多模型支持:可按会话切换模型
- 静默模式:消息发送支持 silent 参数
📦 使用建议
此 Skill 可作为 AI Agent 的通用能力参考。在实际部署时,各项能力的具体可用范围取决于:
- 运行环境的权限配置(sandbox/exec/browser 策略)
- 消息渠道的接入状态
- MCP Server 注册的品类和工具
生成时间:2026-06-08 | 版本:v1.0