概述

本图表以热力图形式直观展示Kubernetes集群在选定时间段内的告警分布情况,帮助您快速识别告警频发的时间段和类型。

主要功能

1. 告警级别切换

  • 图表上方提供级别筛选器,包含:
    • ○ 致命(Critical)
    • ○ 警告(Warning)
    • ○ 提示(Info)
    • ○ 无(None)
  • 操作:点击对应级别圆点,可单独查看该级别的告警分布。

2. 时间维度展示

  • 默认展示连续7天的告警数据
  • 每天按时间区间(如每1小时或每30分钟)分组统计告警数量
  • 横轴为日期,纵轴为告警类型

3. 告警类型与分组

图表包含以下常见K8s告警类型:

各容器级别 CPU 指标的详细说明,请参见《附录-告警》文档。

4. 热力图解读

  • 每个色块代表某一告警类型在特定时间段的告警次数
  • 颜色深浅表示告警数量多少(颜色越深表示告警越多)
  • 块内数字为具体告警计数

交互操作

1. 查看详细数据

  • 悬停:鼠标悬停在任一色块上,可显示:
    • 告警类型
    • 具体时间点或时间段
    • 告警数量

2. 下钻分析

  • 点击任一计数色块,可进入该时间段(如某一天或某几个小时)的更精细热力图视图,展示该时段内:
    • 按更小时间粒度(如每10分钟)分布的告警详情
    • 关联的Pod/节点/工作负载信息
    • 可进一步跳转至相关日志或事件列表

通过告警总览热力图,您可以快速把握集群健康状态,及时发现异常模式,并快速下钻定位问题根源。

作者:叶奕珺  创建时间:2024-07-25 22:50
最后编辑:叶奕珺  更新时间:2026-01-15 14:15