分布式存储的常见方式

最新推荐文章于 2025-06-19 10:29:44 发布

飞天小蜈蚣

最新推荐文章于 2025-06-19 10:29:44 发布

阅读量506

点赞数 3

CC 4.0 BY-SA版权

文章标签：分布式

本文链接：https://blog.csdn.net/hdh1324/article/details/146346078

今天写一篇概述的文章，前两天有小伙伴想了解下什么是分布式储存，我这边其实也是一知半解，特意查了下，（可任意转发，以下为自行总结，有大神的小伙伴可以评论我来补充）

分布式存储有多种实现方式

1.副本存储（Replication）（常用储存，1个数据存储在多个节点）

原理：将完整的数据副本存储在不同的节点上，通常每个节点都保存完整的数据集。
优点：
- 高可用性：某个节点故障时，其他节点仍可提供服务。
- 读取性能高：可以从多个副本并行读取数据。
缺点：
- 存储开销大：每个副本都需要完整的存储空间。
- 写性能较低：需要同步更新所有副本。
应用场景：适用于读多写少的场景，如内容分发网络（CDN）、数据库主从复制。

2. 纠删码存储（Erasure Coding）（Ceph储存，以及HDFS用到的存储，不过大集群使用较多）
原理：将数据分割成多个块，并通过编码生成冗余块，分散存储在不同节点上。即使部分节点丢失，仍可通过剩余块恢复数据。
优点：
- 存储效率高：相比副本存储，纠删码的冗余开销更低。
- 可靠性高：可以容忍多个节点故障。
缺点：
- 计算开销大：编码和解码需要额外的计算资源。
- 恢复速度较慢：数据恢复时需要读取多个块并解码。
应用场景：适用于冷数据存储或大规模分布式存储系统，如HDFS、Ceph。

3. 一致性哈希（Consistent Hashing）（这个我也用的很少）
原理：使用哈希算法将数据和节点映射到一个环形空间，数据存储在与哈希值最接近的节点上。当节点增减时，只需重新分配少量数据。
优点：
- 动态扩展性好：节点增减时数据迁移量小。
- 负载均衡：数据均匀分布在节点上。
缺点：
- 实现复杂：需要维护哈希环和节点映射。
应用场景：适用于动态变化的分布式系统，如分布式缓存（Redis Cluster）、分布式数据库。