一、概述

集群纬度监控模块从全局视角整合计算资源、容器资源、告警、事件、日志等多维度信息,为集群运维提供“资源态势-异常感知-问题定位-根因分析”的全流程支持,助力用户高效保障集群稳定运行。

二、核心监控指标说明

1. 计算资源总览

对集群CPU、内存两类核心计算资源的利用率、申请分配率、限制分配率进行宏观统计展示,涵盖CPU利用率、CPU申请分配率、CPU限制分配率、内存利用率、内存申请分配率、内存限制分配率等关键指标。

2. 容器资源总览

无状态工作负载、有状态工作负载、普通任务、自动伸缩、容器组(Pod)、容器、网络端点、节点、命名空间等维度,展示各类容器资源的总数、可用数、异常数、未就绪数等状态信息。

3. 告警总览

宏观统计视角呈现集群内告警的级别分布、资源类型分布、数量趋势等核心信息,直观反映集群当前告警的整体态势。

4. 告警列表

明细化形式展示每一条告警的具体信息,包括告警时间、涉及资源、告警级别、触发原因、处理建议等。

5. 事件总览

对集群内Kubernetes事件进行类型、资源维度的统计汇总,包括事件类型(正常/警告)、涉及资源(节点/Pod/命名空间)、数量趋势等宏观信息。

6. 事件列表

详细列出每一条Kubernetes事件的具体内容,包括事件时间、涉及资源、事件类型、原因描述、事件状态等。

7. 日志总览

从全局视角展示集群日志的产生量、级别分布(错误/警告/信息)、命名空间/应用维度的分布等宏观信息。

作者:叶奕珺  创建时间:2025-11-03 16:11
最后编辑:叶奕珺  更新时间:2025-12-19 10:11