云服务器MStack提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别云计算服务。云服务器ECS免去了您采购IT硬件的前期准备,让您便捷、高效地使用服务器,实现计算资源的即开即用和弹性伸缩。ECS持续提供创新型服务器,解决多种业务需求,助力您的业务发展。
一、集群概述
集群是由多台物理主机组成的资源聚合单元,通过整合 CPU、内存、存储、网络等资源,为云主机、服务部署提供高效的计算与资源调度能力。本手册围绕集群的查看、连接、配置、成员管理、删除等全生命周期操作展开,确保集群管理的精细化与安全性。
二、集群列表深度查看
在左侧导航栏点击集群管理→集群,进入集群列表页面,各字段及功能解读如下:

- 集群卡片信息:
- 名称:如 “香港正式环境”“测试环境 - 204”“测试环境 - 33”,是集群的业务标识。
 - 状态:“正常” 表示集群资源调度、服务运行无异常;若为 “异常” 需排查主机或网络问题。
 - 计费模式:“包年包月” 表示集群资源按固定周期计费。
 
 - 资源概览:
- 磁盘:“可用 / 总量”(如1.9 TiB / 65.5 TiB),反映存储资源的使用饱和度。
 - CPU 总量:(如72 / 192),表示集群总 CPU 核数及已用核数。
 - 内存总量:“可用 / 总量”(如305.5 GiB / 1.5 TiB),体现内存资源的分配情况。
 - 描述:如openstack6a4bc5fe,是集群的系统标识,用于技术对接与故障排查。
 - 创建时间:(如2025-03-20 10:25:24),记录集群的创建时刻。
 
 - 操作按钮:
- “详情”:进入集群详情页,查看主机、项目、成员等细粒度信息。
 - “成员”:管理集群的访问权限,配置不同用户的操作范围。
 
 - 搜索与刷新:
- 搜索框:输入集群编号、名称、别名等属性,支持模糊搜索,快速定位目标集群。
 - 刷新按钮:点击可同步最新的集群状态与资源数据。
 
 
三、集群详情多维解析
以 “测试环境 - 33” 为例,点击 “详情” 进入集群详情页,模块功能如下:

基本信息区:
- 描述:可点击编辑图标修改,用于补充集群的业务说明(如 “测试环境 - 33 用于 OpenStack 功能验证”)。
 - 状态:“正常” 表示集群整体运行健康;若为 “异常”,需结合主机状态、网络配置排查。
 - 版本:如 “V3”,标识集群所基于的平台版本。
 - 更新时间:(如2025-09-09 09:00:52),记录集群配置或状态的最近变更时间。
 
主机标签页:
- 主机列表:展示集群内所有物理主机的资源与状态,字段包括:
 - 主机名称:如node27 node33 node23,部分主机附带 IP(如10.0.19.27),用于网络定位。
 - CPU:“已用 / 总量”(如66/48),反映主机 CPU 的负载与核数。
 - 内存:“已用 / 总量”(如140.0GB / 377.7 GB),体现主机内存的使用情况。
 - 本地磁盘:“已用 / 总量”(如710 GB / 8941 GB),展示主机本地存储的占用率。
 - 云主机:该主机上运行的云主机数量,反映主机的资源承载量。
 - 状态:“可用” 表示主机可正常调度资源;若为 “维护中”,需确认是否在进行升级或故障修复。
 
操作:
- “热迁移”:将云主机从当前主机迁移至其他主机,过程中业务不中断(需主机支持迁移功能)。
 - “疏散”:将主机上的所有云主机迁移至其他主机,通常用于主机维护前的资源清空。
 
项目标签页:查看集群内关联的项目,了解各项目的资源分配与使用情况。
- 成员标签页:管理集群的成员权限,配置用户对集群的访问、操作范围。
 
四、集群连接与环境更新

- 集群连接(新增集群接入)
- 点击集群列表的连接集群按钮,按照以下流程操作:
 - 选择云服务商:根据待接入集群的技术架构,选择 OpenStack、vSphere、Nutanix 等服务商类型。
 
 - 配置连接信息:
- 若为 OpenStack 集群,需上传clouds.yaml文件(获取方式:登录云管平台→API Access 菜单→Download OpenStack RC File→下载 Yaml 文件),或手动输入auth_url、用户名、项目 ID、密码等参数。
 - 若为 vSphere/Nutanix 集群,需输入平台 IP、端口、管理员账号密码等信息。
 - 配置集群信息:设置集群名称、资源范围(如数据中心、集群名称)。
 - 确认订单信息:核对集群资源规格、计费模式、服务期限等。
 - 完成接入:提交配置后,系统自动执行集群发现与资源同步,完成后可在集群列表查看新接入的集群。
 
 - 环境修改(以 OpenStack 为例)
- 在集群详情页点击更新连接,弹出 “修改环境” 窗口:
 
 - 点击 *+ 选择文件 *,上传最新的clouds.yaml文件(若 OpenStack 平台的认证信息、API 地址变更,需重新下载该文件)。
 - 点击确认,系统自动校验并更新集群的连接信息,确保平台与 OpenStack 集群的通信正常。
 
五、集群设置精细化配置
点击集群详情页的设置按钮,弹出 “设置” 窗口,分模块配置如下:
基本信息
- 名称:集群的显示名称(必填项),需简洁且具有业务辨识度(如 “测试环境 - 33 核心服务集群”)。
 - 描述:补充集群的业务说明、用途等信息(字符限制 0~255 个),便于团队协作识别。
 - 点击确定,保存基本信息变更。
 
监控与告警

- 监控地址:填写 Prometheus 监控服务的访问地址(如http://10.6.122.60:9091/),用于采集集群的资源 metrics。
 - 是否需要账号密码:开关控制 Prometheus 是否启用身份认证,若开启需后续配置账号密码。
 - 图表中心地址:填写 Grafana 的访问地址(如http://10.6.122.60:3000/),用于可视化展示监控数据。
 - 图表中心账号 / 密码:Grafana 的登录凭证,确保平台可正常访问图表数据。
 - 指标设置:点击 “指标设置”,选择需监控的资源指标(如 CPU 使用率、内存使用率、磁盘 IO 等),配置告警阈值。
 - 点击确定,完成监控与告警配置,实现集群资源的实时监控与异常告警。
 
资源

- 命令行地址转换:配置内部地址到外部地址的映射规则(如127.0.0.1:6080–>192.168.0.9:6080),便于外部访问集群内的服务。
 - 脚本:开关控制创建云主机时是否显示初始化脚本内容,开启后可在云主机创建流程中查看或编辑脚本。
 - 禁用创建服务器修改:开关控制非管理员用户是否可修改云主机的网络、存储配置,开启后仅管理员可调整,保障资源配置的规范性。
 - 宿主机信息:以 JSON 格式配置物理主机的登录凭证(如用户名、IP、端口),示例:
{ "openstackEnvName": "test-33", "hosts": [ { "username": "root", "port": "22", "ip": "10.6.122.33" }, { "username": "root", "port": "22", "ip": "10.6.122.23" } ] }点击确定,保存资源配置,实现集群资源的精细化管控。
 
网络

- 支持网络类型:输入集群支持的网络技术类型,多个类型以 “,” 分隔(如VXLAN,VLAN,FLAT,LOCAL)。其中:
 - VXLAN:虚拟扩展局域网,用于大二层网络隔离。
 - VLAN:虚拟局域网,基于物理网络的二层隔离。
 - FLAT:扁平网络,无额外隔离的网络模式。
 - LOCAL:本地网络,仅主机内部通信。
点击确定,保存网络配置,确保集群网络资源的兼容性与隔离性。
 
六、集群成员权限管理
点击集群列表或详情页的成员按钮,进入成员管理页面:
- 添加成员:输入用户名,选择权限范围(如 “管理员”“运维人员”“查看人员”),管理员具备集群的全量操作权限,运维人员可执行资源调度,查看人员仅能查看集群信息。
 - 修改成员权限:对已添加的成员,可调整其权限范围,细化操作边界。
 - 删除成员:移除不需要访问集群的用户,保障集群访问的安全性。
 
七、集群删除与风险提示
如需删除集群,点击集群详情页的删除按钮,弹出确认提示框 “您已经选择【openstack9cfdbcbdf】环境,请确认您的选择,该云主机将被删除?”:
- 操作风险:删除集群会导致其下所有云主机、存储、网络资源被删除,数据无法恢复,操作前需确保业务已迁移或无需保留。
 - 确认删除:输入 “DELETE”(部分场景需严格大写)后点击确定,执行删除流程。
 - 取消删除:点击取消,放弃删除操作,保留集群资源。
 
八、集群批量操作
在集群列表页面,勾选多个集群后:
- 批量删除:点击批量删除按钮,按提示输入 “DELETE” 确认后,可批量删除选中的集群(需确保所有集群的资源均无业务依赖)。
 
九、常见问题与解决
| 问题场景 | 可能原因 | 解决方法 | 
|---|---|---|
| 集群状态 “异常” 主机故障、网络不通、认证失效 | 检查集群内主机的运行状态,测试平台与集群的网络连通性,重新配置认证信息(如更新clouds.yaml) | |
| 主机热迁移失败 | 目标主机资源不足、迁移功能未开启 | 确认目标主机有足够的 CPU、内存资源,检查主机是否启用热迁移功能(如 OpenStack 的迁移策略配置) | 
| 监控数据未采集 | 监控地址配置错误、服务未启动 | 核对 Prometheus、Grafana 的访问地址,确保监控服务正常运行,重启监控组件后重试 | 
作者:吴升斌  创建时间:2022-04-15 16:53
最后编辑:吴升斌 更新时间:2025-11-04 18:17
最后编辑:吴升斌 更新时间:2025-11-04 18:17