概述

告警列表是监控系统的核心组件,用于集中展示和管理Kubernetes集群中所有活跃的告警信息。该模块提供实时告警状态查看、多维度筛选、快速诊断和批量操作功能,帮助运维人员及时发现和处理集群异常。

主要功能

1. 交互式表格

列名 功能说明 交互特性
操作 提供对单个告警的操作入口 包含【详情】、【诊断】按钮
告警名称 告警的具体名称 可筛选、可排序
级别 告警严重程度,如:致命(Critical)、警告(Warning)、提示(Info) 可筛选、可排序
详情信息 简要描述告警内容
资源类型 触发告警的资源类型 可筛选、可排序
命名空间 资源所属的Kubernetes命名空间 可筛选、可排序
资源名称 触发告警的具体资源名称 支持输入字符串过滤、可排序
产生时间 告警首次触发的时间 可排序
结束时间 告警结束或恢复的时间(若未恢复则显示“未清除”) 可排序
清除状态 告警当前状态,如:已清除、未清除 可筛选、可排序

2. 查看告警详情

点击”详情”按钮,打开告警详情面板,显示:

  • 告警触发条件
  • 时间线信息
  • 容器/资源状态
  • 关联标签和注释
  • 相关操作链接(查看资源、规则、事件、日志、图表)

3. 使用AI诊断

  1. 点击目标告警行的”诊断”按钮

  2. 窗口右侧打开AI聊天界面

  3. 自动填充告警上下文信息

  4. AI分析后提供:

  • 根本原因分析
  • 常见解决方案
  • 相关文档链接
作者:叶奕珺  创建时间:2024-08-14 11:10
最后编辑:叶奕珺  更新时间:2026-01-15 14:15