主机是集群的物理计算节点,承载云主机的运行。通过主机管理可实现资源监控、热迁移、疏散及服务管理,保障集群资源的高效调度与稳定运行。
主机列表查看
在左侧导航栏点击集群管理→主机,进入主机列表页面,可查看:
资源信息图表:
- CPU:已用 / 总量(如132/153,使用率86.27%),直观展示 CPU 资源负载。
 - 内存:已用 / 总量(如292 GiB/1007 GiB,使用率28.99%),反映内存资源消耗。
 - 磁盘:已用 / 总量(如2 TiB/26 TiB,使用率6.19%),体现存储资源占用。
 
主机标签页:
- 主机名称:如node27 node33 node23,部分附带 IP(如10.0.19.27)。
 - CPU:已用 / 总量(如66/48),展示主机 CPU 负载与核数。
 - 内存:已用 / 总量(如140.0GB / 377.7 GB),体现主机内存使用情况。
 - 本地磁盘:已用 / 总量(如710 GB / 8941 GB),展示主机本地存储占用率。
 - 云主机:该主机上运行的云主机数量。
 - 状态:“可用” 表示主机可正常调度资源。
 - 操作:“热迁移”“疏散”。
 
服务标签页:
- 主机名称:如node33 node27 node23。
 - 服务类型:如nova-scheduler nova-conductor nova-compute,是 OpenStack 集群的核心服务组件。
 - 应用状态:“可用” 表示服务运行正常。
 - 状态:“开启” 表示服务处于运行状态。
 - 更新时间:服务状态的最近更新时刻。
 - 操作:“停用” 可停止对应服务(需谨慎操作,避免影响集群功能)。
 
主机热迁移
热迁移可将主机上的所有云主机迁移至其他主机,过程中业务不中断,常用于主机维护前的资源迁移:
- 在主机列表的 “操作” 列,点击目标主机的热迁移按钮,弹出 “主机 - 云主机热迁移” 窗口。
 - 仔细阅读提示 “热迁移此主机中所有云主机后,操作后可以通过云主机列表查看”。
 - 在输入框中严格输入大写的 “OK”(注意区分大小写,输入错误将无法确认迁移)。
 - 点击确定按钮,启动热迁移流程;若放弃迁移,点击 “关闭” 按钮即可。
 
主机疏散
疏散操作与热迁移类似,可将主机上的所有云主机迁移至其他主机,保障主机维护时的业务连续性,操作流程参考 “主机热迁移”,点击疏散按钮后按提示执行即可。
主机服务管理
在 “服务” 标签页,可对主机上的服务进行启停操作:
- 停用服务:点击目标服务的停用按钮,可停止该服务(如nova-compute服务停用后,主机将无法承载新的云主机创建,需确保业务无依赖后操作)。
 - 启用服务:若需恢复已停用的服务,可在服务列表中找到对应服务,点击启用按钮(需结合集群服务依赖关系,避免服务异常)。
 
主机资源监控与优化
通过资源信息图表可实时监控主机的 CPU、内存、磁盘使用率:
- 若 CPU 或内存使用率长期过高,可通过热迁移分散负载,或升级主机硬件资源。
 - 若磁盘使用率过高,可清理无用数据或扩容本地磁盘。
 
常见问题与解决
| 问题场景 | 可能原因 | 解决方法 | 
|---|---|---|
| 热迁移失败 | 目标主机资源不足、迁移功能未开启 | 确认目标主机有足够的 CPU、内存资源,检查主机是否启用热迁移功能(如 OpenStack 的迁移策略配置) | 
| 服务停用后集群功能异常 | 服务依赖关系未理清 | 参考 OpenStack 服务依赖文档,逐步恢复相关服务,确保服务启动顺序正确 | 
| 主机资源使用率过高 | 业务负载过大或资源分配不合理 | 执行热迁移分散负载,调整云主机资源配置(如增加 CPU、内存),或升级主机硬件 | 
作者:吴升斌  创建时间:2025-11-04 15:25
最后编辑:吴升斌 更新时间:2025-11-04 18:17
最后编辑:吴升斌 更新时间:2025-11-04 18:17