主机是集群的物理计算节点,承载云主机的运行。通过主机管理可实现资源监控、热迁移、疏散及服务管理,保障集群资源的高效调度与稳定运行。

主机列表查看

在左侧导航栏点击集群管理→主机,进入主机列表页面,可查看:

资源信息图表:

  • CPU:已用 / 总量(如132/153,使用率86.27%),直观展示 CPU 资源负载。
  • 内存:已用 / 总量(如292 GiB/1007 GiB,使用率28.99%),反映内存资源消耗。
  • 磁盘:已用 / 总量(如2 TiB/26 TiB,使用率6.19%),体现存储资源占用。

主机标签页:

  • 主机名称:如node27 node33 node23,部分附带 IP(如10.0.19.27)。
  • CPU:已用 / 总量(如66/48),展示主机 CPU 负载与核数。
  • 内存:已用 / 总量(如140.0GB / 377.7 GB),体现主机内存使用情况。
  • 本地磁盘:已用 / 总量(如710 GB / 8941 GB),展示主机本地存储占用率。
  • 云主机:该主机上运行的云主机数量。
  • 状态:“可用” 表示主机可正常调度资源。
  • 操作:“热迁移”“疏散”。

服务标签页:

  • 主机名称:如node33 node27 node23。
  • 服务类型:如nova-scheduler nova-conductor nova-compute,是 OpenStack 集群的核心服务组件。
  • 应用状态:“可用” 表示服务运行正常。
  • 状态:“开启” 表示服务处于运行状态。
  • 更新时间:服务状态的最近更新时刻。
  • 操作:“停用” 可停止对应服务(需谨慎操作,避免影响集群功能)。

主机热迁移

热迁移可将主机上的所有云主机迁移至其他主机,过程中业务不中断,常用于主机维护前的资源迁移:

  • 在主机列表的 “操作” 列,点击目标主机的热迁移按钮,弹出 “主机 - 云主机热迁移” 窗口。
  • 仔细阅读提示 “热迁移此主机中所有云主机后,操作后可以通过云主机列表查看”。
  • 在输入框中严格输入大写的 “OK”(注意区分大小写,输入错误将无法确认迁移)。
  • 点击确定按钮,启动热迁移流程;若放弃迁移,点击 “关闭” 按钮即可。

主机疏散

疏散操作与热迁移类似,可将主机上的所有云主机迁移至其他主机,保障主机维护时的业务连续性,操作流程参考 “主机热迁移”,点击疏散按钮后按提示执行即可。

主机服务管理

在 “服务” 标签页,可对主机上的服务进行启停操作:

  • 停用服务:点击目标服务的停用按钮,可停止该服务(如nova-compute服务停用后,主机将无法承载新的云主机创建,需确保业务无依赖后操作)。
  • 启用服务:若需恢复已停用的服务,可在服务列表中找到对应服务,点击启用按钮(需结合集群服务依赖关系,避免服务异常)。

主机资源监控与优化

通过资源信息图表可实时监控主机的 CPU、内存、磁盘使用率:

  • 若 CPU 或内存使用率长期过高,可通过热迁移分散负载,或升级主机硬件资源。
  • 若磁盘使用率过高,可清理无用数据或扩容本地磁盘。

常见问题与解决

问题场景 可能原因 解决方法
热迁移失败 目标主机资源不足、迁移功能未开启 确认目标主机有足够的 CPU、内存资源,检查主机是否启用热迁移功能(如 OpenStack 的迁移策略配置)
服务停用后集群功能异常 服务依赖关系未理清 参考 OpenStack 服务依赖文档,逐步恢复相关服务,确保服务启动顺序正确
主机资源使用率过高 业务负载过大或资源分配不合理 执行热迁移分散负载,调整云主机资源配置(如增加 CPU、内存),或升级主机硬件
作者:吴升斌  创建时间:2025-11-04 15:25
最后编辑:吴升斌  更新时间:2025-11-04 18:17