MStore是一个高效的数据管理解决方案,支持文件共享、块存储和对象存储等多种服务。它以高可用性、可扩展性和灵活性著称,适用于大规模数据存储需求。通过分布式架构,MStore提供可靠的数据访问和存储能力,同时兼容多种操作系统和应用场景,是现代 IT 环境中的理想选择。

存储池(Pool)

Pool是数据存储的基本单位,用于组织对象存储,提供数据冗余和高可用性。每个Pool可以设置不同的副本数、存储组数量和存储策略,以满足不同应用场景的需求。

纠删码(Erasure Code)

一种节省存储空间的冗余保护机制,通过将数据分片并附加校验块,使系统在部分硬盘或节点故障时仍能恢复数据;相比副本模式(replicated pool),它能在保证可靠性的同时显著降低存储开销。

清洗规则(Scrubbing)

一致性校验机制,用于定期检查和修复存储池中对象数据的完整性。清洗分为:

  • 普通清洗(scrub):检查对象元数据;
  • 深度清洗(deep-scrub):比对对象内容哈希,确保数据未损坏。

运维人员可根据业务重要性与性能影响,合理配置纠删码策略与清洗计划,以在数据安全与性能之间取得平衡。

块存储(RBD)

全称(RADOS Block Device)一种基于对象存储的块设备,支持快照、克隆、扩容等操作,可作为虚拟机磁盘或容器持久卷使用。每个 RBD 镜像(Image)对应存储池中的一组对象数据。

卷(Image)

卷是基于对象存储的虚拟块设备,它将池(Pool)中的对象组合成一个可挂载的块设备。每个 RBD 镜像都是独立的存储单元,可用于虚拟机磁盘、容器卷或应用数据存储。

主要特点:

  • 可扩展性:RBD 镜像大小可动态扩展,无需中断使用。
  • 快照与克隆:支持快速创建快照(Snapshot),以及基于快照的克隆镜像,实现高效备份和数据复制。
  • 高可用性:借助 Ceph 的冗余机制(副本或纠删码),镜像数据在节点故障时仍可恢复。
  • 多访问方式:镜像可通过原生 RBD 协议直接挂载,或通过 iSCSI 暴露给外部系统。
  • 安全删除:支持移动到回收站(Trash)后再恢复或彻底删除,防止误操作导致数据丢失。

iSCSI 网关

暴露 RBD 镜像,使物理服务器或操作系统通过标准 iSCSI 协议挂载使用,而无需直接访问集群。

回收站(Trash)

用于安全管理被删除的镜像。当执行移入回收站后,镜像不会立即删除,而是进入回收站区域,可在设定的保留时间内通过回收站恢复;如需彻底清理,可执行永久删除命令。该机制有效防止误删数据,便于后续恢复与运维审计。

文件存储

文件系统

提供的分布式文件存储服务,基于 RADOS 对象存储构建,支持 POSIX 接口。CephFS 可以将数据组织成目录和文件,提供类似传统文件系统的访问方式,同时具备集群的高可用性和可扩展性。

  • RADOS(Reliable Autonomic Distributed Object Store)
    是集群的核心对象存储层,它负责在集群中分布、存储和管理数据对象。RADOS 提供高可靠性、自动修复和弹性扩展能力,所有上层存储服务是构建在 RADOS 之上的。它通过对象(Object)而非块或文件来存储数据,每个对象具有唯一的标识,可直接读写和管理。
  • POSIX(Portable Operating System Interface)
    是一种标准操作系统接口规范,用于文件系统的访问和管理。支持 POSIX 接口,使用户和应用可以像使用传统文件系统一样,进行文件的创建、读取、写入、权限管理等操作,保证对应用的兼容性和易用性。

卷(Subvolume)

一种逻辑隔离的目录空间,相当于一个独立的文件系统实例。每个子卷都有自己的 配额(Quota) 和 权限设置,便于多租户或不同应用之间的数据隔离与管理。

网络文件系统(NFS)

将文件系统或块存储暴露给外部系统的标准网络文件共享服务。通过 NFS,用户和应用可以像访问普通网络文件系统一样访问存储,而无需直接理解集群的对象存储架构。

主要特点:

  • 分布式存储:文件系统数据分布在整个集群,自动实现冗余与负载均衡。
  • 可扩展性:支持增加存储节点而无需停机,容量可动态扩展。
  • 标准协议访问:通过 NFSv3 或 NFSv4,Linux、Windows 等系统都可挂载使用。
  • 多客户端共享:NFS 提供的共享访问模式适合多客户端协同工作场景。
  • 安全与管理:可配合集群权限机制进行访问控制,同时支持快照、配额和回收机制。

RGW(对象存储)

是对象存储服务的网关组件。它允许用户通过标准接口如S3或Swift协议访问集群中的对象存储资源,支持多租户环境下的高效管理和资源共享,并且能够集成多种安全机制以确保数据的安全性。

User(对像存储用户)

RGW 的访问实体,每个用户拥有独立的 Access Key / Secret Key。
用户用于身份认证和权限控制,可以创建、管理自己的 Buckets 和对象。

Gateway(网关)

提供 HTTP/HTTPS 接口,接收用户请求并将其转换为 RADOS 对象操作。
支持多实例部署,实现高可用和负载均衡。

Bucket(桶/存储)

用户在 RGW 下的命名空间,用于存储对象(Object)。
每个 Bucket 内可以存放任意数量的对象,支持权限控制、生命周期策略和版本管理。
相当于一个逻辑目录或存储容器。

Object(对象/文件)

存储在 Bucket 中的具体数据单位,每个对象有唯一名称(Key)。
可存储任意格式的数据文件,如图片、日志、备份文件等。

集群

Hosts(主机)

指运行 Ceph 守护进程的物理机或虚拟机。
每台主机通常运行一个或多个 OSD、MON、MGR、RGW、MDS 等服务。
运维中可通过主机信息查看节点状态、资源使用和故障情况。

OSDs(对象存储守护进程)

  • 负责管理集群中的物理存储设备(磁盘或分区),存储 RADOS 对象数据。
  • 提供数据读写、复制、纠删码、故障恢复等功能。
  • OSD 是集群的核心存储单元,OSD 数量直接影响集群容量与性能。

Services(服务)

集群中的各类守护进程,包括:

  • RGW(RADOS Gateway):提供对象存储访问接口。
  • iSCSI / NFS Gateways:提供块存储或文件系统共享。
  • 服务状态直接影响集群的健康与功能可用性。

Users(用户)

指集群中被创建用于访问资源的实体,可是系统用户、RBD 用户、RGW 用户等。
不同用户具有不同权限,用于访问 RBD 镜像、文件系统卷或对像存储。

Logs(日志)

集群的操作、监控和故障信息均记录在日志中,包括:日志是运维排障、性能调优和审计的重要依据。

作者:吴升斌  创建时间:2025-02-27 15:18
最后编辑:吴升斌  更新时间:2025-12-19 18:40