概述
本图表以热力图形式直观展示Kubernetes集群在选定时间范围内各类事件发生频率的可视化图表。通过颜色深浅与数字结合的方式,帮助您快速识别集群中异常事件的时间分布和趋势。

主要功能
1. 事件类型切换
- 图表上方提供事件类型筛选器,包含:
- ○ 正常(Normal)
- ● 警告(Warning)
- 操作:点击对应类型圆点,可切换查看该类型的事件分布。当前示例中显示的是警告事件。
2. 时间维度展示
- 默认展示连续7天的事件数据
- 每天为独立统计单元,展示该日各类事件的总发生次数
- 横轴为日期,纵轴为事件类型
3. 事件类型与分组
图表包含以下K8s核心事件类型:
| 事件类型 | 说明 |
|---|---|
| 重试 | 资源操作(如调度、拉取镜像等)失败后的重试次数 |
| 健康检查失败 | Pod健康检查(Readiness/Liveness)失败事件 |
| IP超出范围 | IP地址分配超出可用范围的事件 |
| FailedSync | Controller Manager同步资源失败 |
| 容器组销毁失败 | Pod删除或清理失败事件 |
| 容器组创建失败 | Pod创建失败事件 |
| OOMKilling | 系统因内存不足终止容器的事件 |
| 无法获取资源指标 | Metrics Server无法获取Pod/节点资源指标 |
各事件类型的详细说明和排查建议,请参见《K8s事件详解与处理指南》文档。
4. 热力图解读
- 每个色块代表某一事件类型在特定日期发生的总次数
- 颜色深浅表示事件数量多少(颜色越深表示事件越多)
- 块内数字为具体事件计数(如:11182表示12月20日”重试”事件发生11182次)
交互操作
1. 查看详细数据
- 悬停:鼠标悬停在任一色块上,可显示:
- 事件类型名称
- 发生日期
- 事件发生总次数
- 事件级别(正常/警告)
2. 下钻分析

- 点击任一计数色块,可进入该事件类型在对应日期的更精细热力图视图,展示:
- 按时间粒度(如每小时)分布的事件发生趋势
- 关联的命名空间、工作负载、Pod列表
- 事件的详细描述和可能原因
- 直接跳转至相关日志或资源详情页面的链接
通过事件总览热力图,您可以快速把握集群的运行状态,识别潜在问题模式,并通过下钻分析精准定位问题根源,提升Kubernetes集群的稳定性和可观测性。
作者:叶奕珺 创建时间:2024-07-25 22:51
最后编辑:叶奕珺 更新时间:2026-01-15 14:15
最后编辑:叶奕珺 更新时间:2026-01-15 14:15