告警管理
查看和处理系统告警信息
活跃告警
3
严重: 1
警告: 2
今日告警
7
已处理: 4
待处理: 3
平均响应时间
15
分钟
↓ 比上周快 23%
告警趋势
↓
本周: 23
上周: 31
告警筛选
活跃告警 (3)
严重程度 | 告警内容 | 设备 | 时间 | 状态 | 操作 | |
---|---|---|---|---|---|---|
严重 |
GPU温度超阈值
GPU 3温度达到75°C, 超过阈值 (70°C)
|
机架3 - 节点3 |
2023-05-12
14:25:33
|
未处理 | ||
警告 |
冷却液流量偏低
冷却液流量为11.2 L/min, 低于理想值 (12.0 L/min)
|
机架2 - 整体系统 |
2023-05-12
13:48:15
|
未处理 | ||
警告 |
GPU内存使用率高
GPU 3内存使用率达到94%, 超过阈值 (90%)
|
机架3 - 节点3 |
2023-05-12
11:05:42
|
未处理 |
显示 1 到 3 共 3 条结果
告警历史统计
告警历史统计图表加载中...
最常见的告警类型
温度告警
42%
功率告警
28%
冷却液告警
18%
告警产生时间分布
工作时间 (9:00-18:00)
35%
非工作时间
65%
告警平均处理时间
严重告警
10分钟
警告告警
25分钟
提示告警
45分钟