概述

本图表以热力图形式直观展示Kubernetes集群在选定时间范围内各类事件发生频率的可视化图表。通过颜色深浅与数字结合的方式,帮助您快速识别集群中异常事件的时间分布和趋势。

主要功能

1. 事件类型切换

  • 图表上方提供事件类型筛选器,包含:
    • ○ 正常(Normal)
    • ● 警告(Warning)
  • 操作:点击对应类型圆点,可切换查看该类型的事件分布。当前示例中显示的是警告事件

2. 时间维度展示

  • 默认展示连续7天的事件数据
  • 每天为独立统计单元,展示该日各类事件的总发生次数
  • 横轴为日期,纵轴为事件类型

3. 事件类型与分组

图表包含以下K8s核心事件类型:

事件类型 说明
重试 资源操作(如调度、拉取镜像等)失败后的重试次数
健康检查失败 Pod健康检查(Readiness/Liveness)失败事件
IP超出范围 IP地址分配超出可用范围的事件
FailedSync Controller Manager同步资源失败
容器组销毁失败 Pod删除或清理失败事件
容器组创建失败 Pod创建失败事件
OOMKilling 系统因内存不足终止容器的事件
无法获取资源指标 Metrics Server无法获取Pod/节点资源指标

各事件类型的详细说明和排查建议,请参见《K8s事件详解与处理指南》文档。

4. 热力图解读

  • 每个色块代表某一事件类型在特定日期发生的总次数
  • 颜色深浅表示事件数量多少(颜色越深表示事件越多)
  • 块内数字为具体事件计数(如:11182表示12月20日”重试”事件发生11182次)

交互操作

1. 查看详细数据

  • 悬停:鼠标悬停在任一色块上,可显示:
    • 事件类型名称
    • 发生日期
    • 事件发生总次数
    • 事件级别(正常/警告)

2. 下钻分析

  • 点击任一计数色块,可进入该事件类型在对应日期的更精细热力图视图,展示:
    • 按时间粒度(如每小时)分布的事件发生趋势
    • 关联的命名空间、工作负载、Pod列表
    • 事件的详细描述和可能原因
    • 直接跳转至相关日志或资源详情页面的链接

通过事件总览热力图,您可以快速把握集群的运行状态,识别潜在问题模式,并通过下钻分析精准定位问题根源,提升Kubernetes集群的稳定性和可观测性。

作者:叶奕珺  创建时间:2024-07-25 22:51
最后编辑:叶奕珺  更新时间:2026-01-15 14:15