← 返回
未分类

Agent Evaluation Report

根据测试数据自动生成标准化的智能体系统评测报告。 Use when: 用户说"生成智能体评测报告"、"创建测试报告"、"项目测试报告"。
根据测试数据自动生成标准化的智能体系统评测报告。使用时机:用户说“生成智能体评测报告”、“创建测试报告”或“项目测试报告”。
luiciferyi
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 381
下载
💾 0
安装
1
版本
#latest

概述

Agent Evaluation Report - 智能体评测报告生成器

飞书文档写入位置

知识库: 7616288931050507220
节点: 效果评测/测试报告

根据测试数据自动生成标准化的智能体系统评测报告。

触发条件

当用户需要以下报告时触发:

  • "生成智能体评测报告"
  • "创建测试报告"
  • "项目测试报告"
  • "AI系统测试报告"
  • "智能体测试报告"

功能

基于用户提供的测试数据,自动生成包含以下章节的标准化报告:

  1. 报告概述(基本信息、执行摘要)
  2. 测试范围与目标
  3. 测试环境(硬件、软件、测试数据)
  4. 测试执行详情(功能测试、性能测试、安全测试、兼容性测试)
  5. 缺陷分析
  6. 业务场景验证
  7. 风险评估
  8. 测试结论与建议
  9. 附录

使用方法

提供以下信息即可生成报告:

项目名称: [项目名称]
测试周期: [开始日期] - [结束日期]
报告日期: [日期]
测试版本: [版本号]

执行摘要: [测试总结]

测试模块:
- 模块1: [描述] - [优先级]
- 模块2: [描述] - [优先级]

功能测试结果:
- [模块名]: 用例数X, 通过Y, 失败Z, 通过率P%

性能测试结果:
- [并发数]: 首字平均响应时间Xs

缺陷列表:
1. [模块] - [描述] - [严重程度] - [状态]

风险评估:
- [风险项] - [影响程度] - [发生概率] - [应对措施]

关键指标:
- 功能测试通过率: X% (目标: Y%)
- 性能响应时间: Xms (目标: Yms)

报告模板结构

1. 报告概述

  • 报告基本信息(项目名称、测试周期、报告日期、测试版本)
  • 执行摘要

2. 测试范围与目标

  • 测试范围(测试模块、测试内容、测试优先级)
  • 测试目标

3. 测试环境

  • 硬件环境(组件、配置、数量)
  • 软件环境(序号、是否携带、名称、部署版本、端口)
  • 测试数据

4. 测试执行详情

  • 功能测试结果(各模块测试项统计)
  • 性能测试结果(负载测试数据表格)
  • 安全测试结果(Web安全、业务逻辑安全、服务器安全、中间件安全)
  • 兼容性测试结果

5. 缺陷分析

  • 关键缺陷列表(编号、模块、描述、严重程度、状态、修复方案)

6. 业务场景验证

  • 核心业务流测试
  • 用户体验评估

7. 风险评估

  • 技术风险(风险项、影响程度、发生概率、应对措施)

8. 测试结论与建议

  • 总体评价
  • 关键指标达成情况
  • 上线建议(立即行动项、短期优化项、长期规划项)
  • 发布建议

9. 附录

  • 测试用例清单
  • 性能测试详细数据
  • 缺陷跟踪记录

输出格式

  • 格式:Markdown / Word文档
  • 保存位置:output/effect-reports/
  • 文件名格式:{项目名称}_效果评测报告_{日期}.md

示例

参考模板:北银金租AI中台建设项目测试报告

  • 测试模块:智能问答Agent、智能问数Agent、智能审单Agent、智能写作Agent
  • 测试维度:功能、性能、安全、兼容性
  • 关键指标:功能测试通过率≥95%、性能响应时间≤500ms、系统可用性≥99.5%

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-05-07 12:41 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

Agent Testcase Generator

luiciferyi
基于测试点生成标准化测试用例,包含前置条件、测试步骤、预期结果、优先级。覆盖功能测试、API测试、UI自动化测试场景。所有用例必须遵循标准格式,详见测试用例标准格式.md。当用户说“生成测试用例”“写测试用例”“测试用例设计”时使用。
★ 0 📥 428

Agent Requirement Analyzer

luiciferyi
分析 AI 智能体平台的需求文档,提取测试需求、功能点、交互场景、边界条件。专注智能体创建、配置、发布、调用全生命周期。 Use when: 用户说"分析需求"、"需求解析"、"智能体需求分析"、"PRD 分析"。 NOT for: 生成测
★ 0 📥 330

Agent Regression Testing

luiciferyi
管理回归测试计划、执行回归测试用例、验证缺陷修复。
★ 0 📥 459