← 返回
数据分析

AWS Health Monitor

Monitor AWS Health Dashboard for active incidents and notify via configurable channels (Feishu, Telegram, Slack, Discord, etc.). Activate when user wants to...
监控 AWS Health Dashboard 的活跃事件,并通过可配置渠道(飞书、Telegram、Slack、Discord 等)发送通知。当用户需要时激活...
shimotsuk1-rei
数据分析 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 549
下载
💾 9
安装
1
版本
#aws#infraops#latest#monitoring#ops

概述

AWS Health Monitor

监控 AWS Health Dashboard 活跃故障,变更时推送通知(支持飞书、Telegram、Slack、Discord 等)。

部署路径

  • 脚本:scripts/aws-health-monitor.py(部署到 workspace/scripts/)
  • 忽略配置:references/aws-health-ignore.example.json(部署为 workspace/scripts/aws-health-ignore.json)
  • 状态文件(运行时自动生成):workspace/scripts/.aws-health-state.json
  • 日志:workspace/logs/aws-health-monitor.log

关键配置(环境变量)

脚本所有关键参数通过环境变量注入,不硬编码:

环境变量说明默认值
------------------------
HTTPS_PROXY / HTTP_PROXY出口代理不使用代理
AWS_HEALTH_NOTIFY_CHANNEL通知渠道(feishu/telegram/slack/discord 等)feishu
AWS_HEALTH_NOTIFY_TARGET通知目标(open_id / chat_id / @username 等)必填
AWS_HEALTH_WATCH_REGIONS监控的 region 白名单,逗号分隔空(监控全部)
AWS_HEALTH_WATCH_SERVICES监控的服务名白名单,逗号分隔空(监控全部)

示例:只监控法兰克福和东京的 EC2、RDS

export AWS_HEALTH_WATCH_REGIONS=eu-central-1,ap-northeast-1
export AWS_HEALTH_WATCH_SERVICES="Amazon EC2,Amazon RDS"

挂 Cron

*/5 * * * * export http_proxy=http://<proxy>:<port> https_proxy=http://<proxy>:<port> AWS_HEALTH_NOTIFY_CHANNEL=<channel> AWS_HEALTH_NOTIFY_TARGET=<target>; cd /path/to/workspace && /usr/bin/python3 scripts/aws-health-monitor.py >> logs/aws-health-monitor.log 2>&1

忽略配置(aws-health-ignore.json)

参考 references/aws-health-ignore.example.json,支持两种忽略方式:

{
  "arns": ["arn:aws:health:me-central-1::event/..."],  // 精确忽略单个 issue
  "services": ["Amazon WorkSpaces", "AWS IoT Core"]    // 按服务名模糊忽略
}

修改后保存即生效,下次轮询自动跳过。

通知触发条件

  • 新 issue 出现
  • 已知 issue 有最新更新(message 变化)
  • issue 从 Dashboard 消失(视为已解决)

通知格式示例

[新故障] | AWS Health Dashboard

Region:UAE
服务:Multiple services
状态:调查中(Increased Error Rates)
首发:2026-03-01 20:51 CST
更新:2026-03-02 13:59 CST

根因:电源故障、数据中心火灾/物理损坏
We are investigating issues with AWS services in the ME-CENTRAL-1 Region

最新进展:
We are investigating additional connectivity issues and error rates...

https://health.aws.amazon.com/health/status

根因提炼逻辑

脚本通过正则匹配 event_log 所有消息文本,识别以下根因类型:

电源故障、数据中心物理损坏、网络故障、连通性问题、硬件故障、软件 Bug、配置变更/错误、变更发布问题、容量/资源耗尽、DNS 问题、证书/TLS 问题、存储故障、内存问题、流量异常/DDoS、上游/第三方问题。

匹配到多个时用顿号拼接;未匹配则显示"暂无明确根因"。

数据来源

GET https://health.aws.amazon.com/public/currentevents(UTF-16 编码 JSON)

旧接口 https://status.aws.amazon.com/data.json 已 301 重定向至此。

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 08:19 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

data-analysis

Stock Analysis

udiedrichsen
{"answer":"基于雅虎财经数据,分析股票与加密货币。支持投资组合管理、自选股预警、股息分析、8维评分、热门趋势扫描及传闻/早期信号探测。适用于股票分析、持仓追踪、财报异动、加密监控、热门股追踪或提前发掘非主流传闻。"}
★ 270 📥 56,960
data-analysis

A股量化 AkShare

mbpz
A股量化数据分析工具,基于AkShare库获取A股行情、财务数据、板块信息等。用于回答关于A股股票查询、行情数据、财务分析、选股等问题。
★ 165 📥 59,995
data-analysis

Data Analysis

ivangdavila
{"answer":"数据分析与可视化。查询数据库、生成报告、自动化电子表格,将原始数据转化为清晰可行的见解。适用于:(1) 您……"}
★ 198 📥 65,105