告警管理

查看和处理系统告警信息

活跃告警

3
严重: 1
警告: 2

今日告警

7
已处理: 4
待处理: 3

平均响应时间

15 分钟
↓ 比上周快 23%

告警趋势

本周: 23
上周: 31

告警筛选

活跃告警 (3)

严重程度 告警内容 设备 时间 状态 操作
严重
GPU温度超阈值
GPU 3温度达到75°C, 超过阈值 (70°C)
机架3 - 节点3
2023-05-12
14:25:33
未处理
警告
冷却液流量偏低
冷却液流量为11.2 L/min, 低于理想值 (12.0 L/min)
机架2 - 整体系统
2023-05-12
13:48:15
未处理
警告
GPU内存使用率高
GPU 3内存使用率达到94%, 超过阈值 (90%)
机架3 - 节点3
2023-05-12
11:05:42
未处理
显示 133 条结果

告警历史统计

告警历史统计图表加载中...

最常见的告警类型

温度告警 42%
功率告警 28%
冷却液告警 18%

告警产生时间分布

工作时间 (9:00-18:00) 35%
非工作时间 65%

告警平均处理时间

严重告警 10分钟
警告告警 25分钟
提示告警 45分钟