1. 告警列表

初次进入云平台总览页面,为了保持页面加载流畅,告警列表卡片只展示最近时间发生的6条告警记录,以简版形式展示。

简版告警列表

  1. 放大按钮,可切换详细版告警列表,展示
  2. 刷新按钮,按当前选择的条件获取最新数据,可显示最多500条记录
  3. 清空按钮,清空当前选择条件,选择条件参考详细版告警列表

详细版告警列表

  1. 通知时间选择器
  2. 告警名称告警级别资源类型命名空间皆为下拉框选择
  3. 资源名称 为输入框

2. 告警详细说明

2.1 资源类型

名称 说明
Cluster 集群
Node 节点
Deployment 无状态工作负载
StatefulSet 有状态工作负载
DaemonSet 守护进程集
Job 任务
Pod 容器组
Container 容器
PersistentVolumeClaim 持久卷申领

2.2 告警级别

名称 说明
提示 此类级别的故障指示可能有潜在的错误影响到提供的服务,相应的措施根据不同的错误进行处理。
警告 此类级别的故障影响到服务质量,需要采取紧急动作。如某设备或资源服务质量下降,需对其进行还原,恢复全部能力,需在工作时间内立即采取措施。
致命 此类级别的故障影响到系统提供的服务,需要立即采取相应动作。如某设备或资源完全不可用,需进行恢复,即使该故障在非工作时间内发生,也需立即采取措施。

2.3. 系统告警列表

告警名称 告警名称(中) 资源类型 告警级别 说明 故障处理
KubePodCrashLooping Pod循环崩溃 容器 警告 Pod 处于 循环崩溃 状态超过15分钟 Pod 处于 CrashLoopBackOff 状态
KubePodNotReady Pod未就绪 容器组 警告 Pod 处于 未就绪 状态超过15分钟
KubeDeploymentGenerationMismatch 无状态工作负载生成不匹配 无状态工作负载 警告
KubeDeploymentReplicasMismatch 无状态工作负载预期副本数不匹配 无状态工作负载 警告 无状态工作负载预期副本数不匹配
KubeStatefulSetReplicasMismatch 有状态工作负载预期副本数不匹配 有状态工作负载 警告 有状态工作负载 与预期副本数不匹配超过15分钟
KubeStatefulSetGenerationMismatch 有状态工作负载生成不匹配 有状态工作负载 警告
KubeStatefulSetUpdateNotRolledOut 有状态工作负载滚动更新未完成 有状态工作负载 警告 有状态工作负载 滚动更新未完成超过15分钟
KubeDaemonSetRolloutStuck 守护进程集部署未完成 守护进程集 警告 守护进程集 部署未完成超过15分钟
KubeContainerWaiting 容器等待 容器 警告 容器 处于 等待 状态超过1小时
KubeDaemonSetNotScheduled 守护进程集调度未完成 守护进程集 警告
KubeDaemonSetMisScheduled 守护进程集调度错误 守护进程集 警告
KubeJobNotCompleted 任务未完成 任务 警告 任务 已经执行了超过12小时
KubeJobFailed 任务失败 任务 警告 任务 执行失败超过15分钟
KubeHpaReplicasMismatch HPA预期副本数不匹配 HPA 警告 HPA 与预期副本数不匹配超过15分钟
KubeHpaMaxedOut HPA达到最大副本数 HPA 警告 HPA 以最大副本数运行已超过15分钟
KubeContainerRestart 容器重启 容器 警告 容器近5分钟内重新次数大于0
作者:叶奕珺  创建时间:2024-08-14 11:10
最后编辑:叶奕珺  更新时间:2025-04-07 16:06