执行诊断时遵守以下规则:
正确做法:
cd scripts
python -c "from orchestrator import analyze_cluster; print(analyze_cluster('集群有什么问题'))"
指定命名空间:
cd scripts
python -c "from orchestrator import analyze_cluster; print(analyze_cluster('检查Pod问题', namespace='kubesphere-logging-system'))"
禁止做法:
用户用自然语言描述问题,AI自动调用k8sskill执行诊断。
触发示例:
| 查询类型 | 示例问法 |
|---------|---------|
| Pod问题 | "检查Pod为什么崩溃" / "为什么有Pod一直在重启" |
| Deployment问题 | "部署失败了怎么回事" / "deployment rollout卡住了" |
| Service问题 | "为什么服务无法访问" / "访问不了我的服务" |
| 节点问题 | "节点有问题" / "检查节点健康状态" |
| 存储问题 | "存储绑定失败" / "PVC无法挂载" |
| 事件日志 | "查看最近事件" / "集群有什么警告" |
| 全量检查 | "集群有什么问题" / "检查所有资源" |
工作负载分析器:
存储和网络分析器:
集群分析器:
配置分析器:
| 用户输入示例 | 执行的分析 |
|-------------|-----------|
| "检查我的Pod为什么崩溃" | PodAnalyzer - 检查容器状态和事件 |
| "为什么服务无法访问" | ServiceAnalyzer + IngressAnalyzer |
| "部署失败了怎么回事" | DeploymentAnalyzer + Event分析 |
| "存储绑定失败" | PVCAnalyzer - 检查PVC状态 |
| "节点有问题" | NodeAnalyzer - 检查节点健康 |
| "查看最近事件" | EventAnalyzer - 分析警告事件 |
| "集群有什么问题" | 全量分析所有资源 |
# 在 scripts/ 目录下执行
from orchestrator import AnalyzerOrchestrator, analyze_cluster
# 方式1: 使用编排器
orchestrator = AnalyzerOrchestrator()
results = orchestrator.analyze("检查Pod问题", namespace="default")
report = orchestrator.format_report(results)
print(report)
# 方式2: 使用便捷函数
report = analyze_cluster("检查集群问题", namespace="production")
print(report)
支持3种配置方式:
config/k8s-Test-admin.conf
~/.kube/config
KUBECONFIG=/path/to/config
# 在 scripts/ 目录下执行
from core import verify_k8s_connection
success, message = verify_k8s_connection()
print(message)
版本: 1.0.0
最后更新: 2026-04-03
共 1 个版本