目录
一、磁盘存储概念
磁盘是计算机的外部存储器设备,由一个或多个覆盖有磁性材料的铝制或玻璃制的碟片组成,用来存储用户的信息,这种信息可以反复地被读取和改写。
1. 磁盘的分类
1.1 依据存储介质区分
- 机械硬盘(HDD,Hard Disk Driver)
采用磁性碟片来存储数据
盘片凸起的地方代表数字1 (磁化为1) ,的地方代表数字0
以二进制来存储表示文字、图片等信息
根据转速来判断硬盘的好坏,一般硬盘转速为7200转/分,大概读取100-200M/s的数据
- 固态硬盘(SSD,Solid State Disk)
- 通过闪存颗粒(固态电子存储芯片阵列)来存储数据
- 不需要机械结构,完全的半导体化,不存在数据查找时间、延迟时间和磁盘寻道时间,数据存取速度快。读取速度可以达到400M/s,写入速度可以达到130M/s以上
- 数据丢失的可能性能够降到最小,没有任何噪音,功耗低
1.2 依据热插拔方式区分
- 热插拔(Hot-Swap)
- 可以在计算机运行时插入或拔出的硬盘,实现服务器高可用性和灵活性
- 需要硬件支持,包括支持热插拔的硬盘托架(Hot-Swap Bay)和主板/控制器
- 非热插拔(Non-Hot-Swap)
- 需要在系统关闭或处于待机状态时才能插入或拔出的硬盘,插入或拔出硬盘需要重启
- 不需要特殊的硬件支持
1.3 依据存储连接方式区分
- 本地存储---如服务器硬盘
- 外部存储---如移动硬盘、U盘
- 网络存储---如网络附件存储(NAS)、存储区域网络(SAN)
- 通过网络连接提供数据存储服务的技术
- 允许多台计算机通过网络访问、读写和共享存储资源,而无需直接连接到存储设备
- 提供了一种集中管理和共享数据的方式,为多用户、多计算机的环境提供了便捷的数据存储和访问解决方案
2. 网络存储介绍
- 网络附加存储(NAS,Network Attached Storage) --- 网络上的文件系统
NAS是一种通过网络连接的存储设备,存储设备通过标准的网络拓扑结构(以太网,Ethernet)添加到一群计算机上,专门用于文件共享和存储。NAS设备通常运行专用的操作系统,提供文件级别的访问,并使用协议如NFS(Network File System)和SMB/CIFS(Server Message Block/Common Internet File System)。
NAS的一个主要缺点是其备份过程中对网络带宽的消耗。与传统的并行SCSI(Small Computer System Interface,小型计算机系统接口)连接相比,NAS将存储事务转移到了网络上。这意味着局域网(LAN)不仅要处理日常的最终用户数据传输,还要额外承担包括备份操作在内的存储磁盘请求。因此,NAS在备份和恢复过程中可能会对网络带宽造成较大的压力。
- 存储区域网络(SAN,Storage Area Network) --- 网络上的磁盘
SAN是一种专用的高性能网络架构,旨在将存储设备(例如硬盘阵列和磁带库)与服务器相连接。这种网络通过光纤通道交换机实现存储阵列与服务器主机之间的连接,从而构建一个独立的存储网络。
SAN允许企业轻松扩展存储容量,并且能够独立于现有的局域网(LAN)进行操作。SAN的结构允许任何服务器连接到任何存储阵列,无论数据放在哪里,服务器都可以直接存取所需的数据。由于采用了光纤接口,SAN还具有更高的带宽。SAN跨平台性能没有NAS好,价格偏高,搭建SAN比在服务器后端安装NAS要复杂,适用于需要大规模数据存储和高性能的企业级应用和数据中心环境。
- 直连存储(DAS,Direct-Attached Storage)
DAS是一种存储解决方案,它将存储设备直接连接到单个计算机或服务器。这种连接通常通过SCSI(Small Computer System Interface,小型计算机系统接口)接口实现,但SCSI通道可能会成为输入/输出(I/O)性能的瓶颈。此外,由于服务器主机的SCSI ID资源有限,能够建立的SCSI通道连接数量也受到限制,这限制了直连式存储和服务器主机的扩展能力。
当业务需求增长,需要从单一服务器扩展到多服务器群集,或者需要增加存储阵列的容量时,DAS的局限性变得更加明显。在此情况下,扩展操作往往会导致业务系统的停机,因为需要重新配置硬件和软件,以及可能的数据迁移,这会对业务连续性造成影响。因此,DAS在处理大规模或高可用性要求的场景时可能不是最佳选择。
- 分布式存储 --- 分布式文件系统(DFS,Distributed File System)
分布式文件系统是一种特殊的分布式存储系统,它将文件存储在多个物理节点上,并通过网络进行访问和管理。该系统提供了统一的文件命名空间,使用户能够像在本地文件系统中一样,在多个节点上访问和操作文件。分布式文件系统的设计通常基于客户端/服务器(C/S)模式,多个服务器为多用户提供访问服务。同时,系统的对等特性允许某些节点同时扮演客户端和服务器的角色,例如,用户可以“发表”一个目录以供其他客户端访问,访问该目录后,对客户端而言就像使用本地驱动器一样。
通过将固定于某个地点的文件系统扩展到多个地点和多个文件系统,分布式文件系统有效解决了数据存储和管理的难题。众多节点组成一个文件系统网络,每个节点可以分布在不同的地理位置,通过网络进行通信和数据传输。这种系统通常部署在大规模集群环境中,提供高度的可伸缩性和冗余性,支持大规模的文件数据存储和访问。常见的分布式文件系统包括Hadoop分布式文件系统(HDFS)和Ceph。
- 云存储服务
云存储服务是在云计算(Cloud Computing)概念上延伸和衍生发展起来的一个新的概念,它代表了存储技术的一种新趋势。云计算本身是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的延伸,它通过互联网将复杂的计算任务自动分解成多个小任务,由多台服务器组成的系统并行处理,并将结果快速返回给用户。这种技术使得服务提供者能够在短时间内处理和分析海量数据。
云存储进一步扩展了这一概念,通过集群应用、网格技术或分布式文件系统等技术手段,将网络中大量的存储设备整合起来,形成一个协同工作的系统,提供数据存储和访问服务。这个系统不仅保障了数据的安全性,还优化了存储空间的使用。简而言之,云存储允许用户通过互联网随时随地访问存储在远程服务器上的数据,无论他们使用的是什么设备,都能方便地存取信息。这种服务模式为用户提供了灵活性和便利性,同时降低了对本地存储硬件的依赖。
二、磁盘分区概念
1. 分区的作用
- 便于管理硬盘上的数据:通过将硬盘分成多个区域,用户更容易区分不同类型的数据,例如操作系统文件、应用程序、用户文件等。有助于使文件系统更有序,提高数据管理的效率。
- 有助于提高硬盘的性能:将操作系统和应用程序安装在不同的分区上,有效减少磁头的移动,提高了访问速度。
- 提高数据安全性:将操作系统和用户数据分开存放在不同的分区中,更容易进行备份和恢复操作系统,而不影响用户数据。如果系统发生故障,也更容易对某个分区进行修复,而不影响其他分区。
- 支持多重引导:允许在同一硬盘上安装多个操作系统,每个操作系统可以安装在不同的分区上,用户可以在启动时选择要启动的操作系统。
- 有效地利用硬盘空间:用户可以在单个硬盘上创建一个用于操作系统和应用程序的小分区,而将其余的空间用于存储用户数据。有效的管理硬盘空间,防止某个区域的数据过度增长导致空间不足。
2. 分区表的分类
2.1 MBR(Master Boot Record)
MBP分区表是一种用于在计算机硬盘上管理分区和引导操作系统的标准分区方案。MBR分区表通常位于硬盘的第一个扇区(逻辑块0),其大小为512字节。这个512字节的区域包含了分区表以及引导加载程序的代码。
关键特点:
- 分区表:MBR分区表最大支持4个主分区。每个主分区可以包含一个独立的文件系统,如FAT32或NTFS。如果需要更多的分区,其中一个主分区可以被指定为扩展分区。
- 扩展分区:是主分区中的一个,用于容纳逻辑分区。逻辑分区数量不受主分区数量限制,因此扩展分区允许更多的分区。但是,扩展分区本身不能直接用于存储数据,而只是作为逻辑分区的容器。
- 引导加载程序:MBR中的最后两个字节(511和512)通常包含引导加载程序的代码。这是计算机启动时执行的代码,用于加载操作系统的引导扇区。引导加载程序的任务是在硬盘上找到操作系统的引导扇区,并将控制权传递给该引导扇区。
- MBR限制:MBR分区表的设计存在一些限制,其中最突出的是对分区的数量和大小的限制。由于历史原因,MBR分区表最多支持4个主分区,且主分区和扩展分区的大小限制为2TB。
- Legacy系统支持:MBR分区表是早期计算机系统和BIOS固件的标准,支持的操作系统包括DOS、Windows、Linux等。然而,由于其限制,对于现代计算机和大容量硬盘,通常采用更先进的分区方案,如GPT(GUID Partition Table)。
2.2 GPT(GUID Partition Table)
GPT分区表是一种用于在计算机硬盘上管理分区的现代分区方案。
关键特点:
- GUID(Globally Unique Identifier):GPT使用128位的GUID作为每个分区的唯一标识符。这样的设计使得GPT支持更多的分区,避免了MBR中限制分区数量的问题。
- 支持更大的硬盘容量:GPT分区表支持更大容量的硬盘,可以处理超过2TB的硬盘空间。相对于MBR,GPT的硬盘容量限制大大提高,适应了现代大容量硬盘的需求。
- 主分区和逻辑分区的差异消失:GPT不再有主分区和扩展分区的概念。所有分区都是主分区,因此不再受到主分区数量的限制。GPT支持更多的分区类型,包括备份分区表、EFI系统分区等。
- 更强的数据完整性和容错性:GPT包含备份分区表,存储在硬盘的末尾,以提高数据完整性和容错性。如果主分区表损坏,系统可以使用备份分区表进行恢复。
- 安全性增强:GPT使用CRC32校验和其他方法来验证分区表的完整性,以帮助检测潜在的数据损坏,有助于提高硬盘的可靠性。
- UEFI兼容性:GPT分区表是UEFI(Unified Extensible Firmware Interface)标准的一部分,与现代计算机使用的新一代固件兼容。与MBR不同,GPT分区表不受BIOS引导时的限制。
2.3 MBR和GPT的区别
- MBR分区表最多只能识别2TB左右的空间,大于2TB的容量将无法识别从而导致硬盘空间浪费;GPT分区表则能够识别2TB以上的硬盘空间。
- MBR分区表最多只能支持4个主分区/3个主分区+1个扩展分区(逻辑分区不限制);GPT分区表在Windows系统下可以支持128个主分区。
- MBR分区表中的大小是固定的;GPT分区表头中可自定义分区数量的最大值,即GPT分区表的大小不是固定的。