通过静态阈值规则可对资源(主机、项目、实例)的指标(CPU内核占用、CPU内核总量、CPU使用率、内存使用量、内存使用率、磁盘读写速率、网络上下行速度、状态)设置阈值条件,当指标数据满足阈值条件时产生阈值告警。

通过在消息通知服务界面设置主题及订阅邮箱,当静态阈值规则的状态(正常、超限阈值)发生变化时,会以邮件方式通知,以便您在第一时间发现异常并进行处理。


创建方式

  • 当需要单独监控某个资源(主机、项目、实例)时,操作详见自定义静态阈值规则

  • 根据运维经验,对所有主机和所有项目的关键指标(包括CPU使用率指标、内存使用率指标、主机磁盘使用率指标、主机状态指标、项目状态指标)预置了默认批量阈值规则。

    您不用进行复杂的操作,单击按钮即可一键创建,操作详见一键创建默认批量静态阈值规则

  • 如果默认批量静态阈值规则不能满足需求时,您需使用静态阈值模板进行创建,操作详见使用模板创建静态阈值规则

  • 静态阈值模板是为创建批量静态阈值规则做准备的,您需先创建一个静态阈值模板,操作详见创建静态阈值模板


自定义静态阈值规则

  1. 登录控制台,左侧导航栏中选择“告警中心 > 阈值规则”,单击右上角的“添加阈值”。

  2. 自定义静态阈值规则
    a. 选择资源:
    1) 在“阈值名称”中输入阈值规则名称
    2) 单击“自定义创建”
    3) 选择资源类型(项目实例、主机)
    4) 在资源树上选择待监控的资源(项目、实例、主机)
    5) 单击“下一步”。

    图1 选择资源

    说明:

    • 当选择多个资源时,创建操作完成后,会创建多个单条静态阈值规则,每个资源对应一个单条静态阈值规则。规则命名方式为:您在“阈值名称”文本框中设置的阈值规则名称加上0至9的序号(序号和资源选择时的先后顺序有关,先选择的资源序号越小,后选择的资源序号越大)。
      例如,在“阈值名称”文本框中输入阈值规则名称:Monitor_Host_cpuUsage,在资源树上选择资源时,先选择主机my1014-92558,再选择主机my1014-master-1。创建操作完成后,会生成两条阈值规则Monitor_Host_cpuUsage0(其监控的对象为主机my1014-92558)和Monitor_Host_cpuUsage1(其监控对象为主机my1014-master-1)。

    b. 定义阈值:选择待监控的指标,设置阈值条件、连续周期、告警级别、统计方式等参数,选择是否发送通知。
    图2 定义阈值

    • 阈值条件:阈值告警的触发条件,由判断条件(>=、<=、>、<)和阈值组成。例如,阈值条件设置为“>85”,表示指标的实际值大于已设置的阈值85时,生成阈值告警。
    • 连续周期:连续多少个周期满足阈值条件,发送阈值告警。
    • 统计方式:指标数据按照用户设置的统计方式生效。
    • 统计周期:指标数据按照用户设置的统计周期生效。
    • 选择是否发送通知:当静态阈值规则状态(正常、超限阈值)发生变化时,选择是否发送邮件通知该变动。
      • 如需使用邮件方式发送通知,请选择“是”,则需设置通知策略,选择已创建的主题,选择触发场景。
      • 如不需接收邮件通知,请选择“否”。
    • 触发场景:发送通知的触发条件。
      触发场景您可选择多个。例如,当阈值状态变为超限阈值时,您需要收到通知,则触发场景选择超限阈值;只要阈值状态发生变化时,您都需要收到通知,则触发场景可以全选。
  3. 单击“添加”,完成创建。如下图所示,创建了多个单条静态阈值规则,一个资源对应一个规则,可使用独立的规则对某个资源进行监控。

    如下图所示,对于一个单条静态阈值规则,其监控对象为某个主机,当主机的CPU使用率超过85%时,在告警界面产生阈值告警,可在左侧导航栏中选择“告警中心 > 告警列表”,在告警列表中查看该告警;当主机满足已设的通知策略时,就会发送邮件或短信。

    图3 单条静态阈值规则


一键创建默认批量静态阈值规则

  1. 登录控制台,左侧导航栏中选择“告警中心 > 阈值规则”。

  2. 进入“规则列表”页签,单击“一键创建默认阈值”。
    应用运维管理会自动创建7个静态阈值模板(可单击“静态阈值模板”页签,在列表中进行查看)
    于此同时应用运维管理也会使用这7个模板分别创建7个默认的批量静态阈值规则(其监控对象为所有的主机或所有的项目,如图4所示)。例如,单击[node:default-static-rule] CPU Usage前的,可批量监控您所有主机的CPU使用率。

    图4 默认批量静态阈值规则


使用模板创建静态阈值规则

使用模板创建静态阈值规则前,请先创建一个静态阈值模板,操作详见创建静态阈值模板

  1. 登录控制台,左侧导航栏中选择“告警中心 > 阈值规则”,单击右上角“添加阈值”。

  2. 选择资源:
    1) 输入阈值规则名称
    2) 单击“模板导入”
    3) 选择待监控的资源
    4) 应用到所有项目

    说明

    • 若开关为关闭状态:需您在资源树上自定义选择一个或多个资源,最多可选择100个资源。
    • 若开关为开启状态:当资源类型为主机时,监控的资源为所有的主机;当资源类型为项目时,监控的资源为所有项目。

    5) 单击“下一步”
    图5 选择待监控的资源

  3. 选择已创建的静态阈值模板。
    图6 选择静态阈值模板

  4. 单击“添加”,完成创建。
    如下图所示,创建了一条批量静态阈值规则,单击其前的尖头,可对其下的多个资源的同一指标批量监控。
    如下图所示,在展开的列表中,只要某个主机的CPU使用率超过85%时,在告警界面就会生成一条阈值告警,您可在左侧导航栏中选择“告警中心 > 告警列表”,在告警列表中查看该告警;只要某个主机满足已设的通知策略,就会发送一条邮件。

    图6 批量静态阈值规则