告警列表

一、概述

告警列表卡片是监控系统中用于集中展示各类系统告警信息的核心模块,帮助用户快速掌握系统中存在的告警情况,及时开展诊断与处理工作,保障系统的稳定运行。

二、功能模块详细说明

1. 操作列

包含「详情」和「诊断」两个功能按钮:

  • 详情:点击可查看告警的完整上下文信息,包括更细致的场景描述、关联资源等内容。
  • 诊断:提供针对该告警的专属诊断工具或分析路径,助力用户快速定位告警产生的根本原因。

2. 告警名称列

  • 展示告警的类型(如示例中的“容器被重启”)。
  • 支持搜索/筛选功能(列头的搜索图标),可快速筛选出特定类型的告警,提升告警定位效率。

3. 级别列

  • 标识告警的严重程度(如示例中的“警告”),帮助用户区分告警优先级。
  • 支持搜索/筛选功能,可优先筛选出高等级告警进行处理,保障系统核心链路稳定。

4. 详情信息列

  • 展示告警的核心信息(如示例中的“上次重启原因、涉及容器”等),让用户无需进入详情页即可掌握告警关键内容。

5. 资源类型列

  • 说明告警涉及的资源类别(如示例中的“容器”)。
  • 支持筛选功能,便于用户按“资源类型”分类管理告警(如单独查看容器类、服务类告警)。

6. 命名空间列

  • 对应 Kubernetes 资源隔离的“命名空间”,用于区分不同项目、环境的资源。
  • 支持筛选功能,多团队协作场景下可快速定位自身负责环境的告警。

7. 资源名称列

  • 展示告警涉及的具体资源实例名称(如示例中的容器名、服务名)。
  • 支持搜索/筛选功能,可精准定位到某一具体资源的告警。

8. 产生时间列

  • 记录告警发生的时间,帮助用户梳理告警时间线、排查时间相关性问题。
  • 支持筛选功能,可查看特定时间段内的告警。

9. 刷新功能

点击右上角刷新图标,可手动更新告警列表,确保展示的是最新告警信息。

三、典型使用场景

  1. 日常巡检:运维人员通过该卡片快速查看系统是否存在新告警,及时发现潜在风险。
  2. 故障排查:系统出现异常时,通过“级别”“资源类型”“告警名称”等筛选条件,快速定位到目标告警,结合“详情”“诊断”功能开展故障分析。
  3. 多团队协作:各团队通过“命名空间”筛选,仅关注自身负责环境的告警,提升协作效率与问题处理速度。

四、常见操作指引

  1. 筛选告警:点击任意列头的搜索图标,输入关键词(如告警名称、资源名称)或选择下拉选项,即可筛选出目标告警。
  2. 查看告警详情:点击“操作列”的「详情」按钮,查看告警完整信息。
  3. 执行告警诊断:点击“操作列”的「诊断」按钮,按照内置诊断流程或工具分析告警原因。
  4. 刷新告警列表:点击右上角刷新图标,获取最新告警数据。
作者:叶奕珺  创建时间:2024-08-14 11:10
最后编辑:叶奕珺  更新时间:2025-11-04 11:36