MySQL分区

1、查看MySQL data目录

show variables like '%datadir%' 

可查看MySQL文件目录,这里面每个数据库对应一个子目录;

2、分区优点

  • 可以让单表存储更多的数据;
  • 分区表的数据还可以分布在不同的物理设备上,从而高效利用多个硬件设备;
  • 根据分区列查询,会过滤无效的分区,只从某些分区查询,提高查询效率;
  • 完全在数据库层面操作,与代码解耦,不需要程序编码;
  • 分区表的数据更容易维护和管理。

3、分区缺点 

  • 分区最多1024个;
  • 要在WHERE条件中带入分区列,有时候即使看似多余的也要带上,这样就可以让优化器能够过滤掉无须访问的分区,否则将访问这个表的所有分区,可能会非常慢;
  • 分区表还有一些其他限制,比如所有的底层表必须使用相同的存储引擎,某些存储引擎也不支持分区;
  • 分区一般应用于一台服务器上,但一台服务器的物理资源总是有限的,当数据达到这个极限时,即使分区,性能也可能会很低,所以这个时候分库是必须的;
  • 分区表无法使用外键约束;
  • NULL 值会使分区过滤无效。

4、分区的类型 

  1. range分区,按照范围进行分区,下面是创建一个range分区表;
    drop table if exists `range_table`;
    create table `range_table`(
    	`id` int,
    	`name` varchar(10)
    ) 
    partition by range(id)(
    	partition p1 values less than (10),
    	partition p2 values less than (20),
    	partition p3 values less than maxvalue
    );
    
  2. list分区,list分区就是在创建各分区时具体指定哪些值属于这些分区 ;
    drop table if exists `list_table`;
    create table `list_table`(
    	`id` int,
    	`name` varchar(10)
    ) 
    partition by list(id)(
    	partition p1 values in (1),
    	partition p2 values in (10,15,50)
    );
  3. hash分区,有常规hash和线性hash两种,区别在于计算上的区别。常规hash是在分区字段上基于分区个数的取模运算,根据余数分区。线性hash是对分区字段进行二次方运算,根据运算结果分区,所以hash分区同样要求分区字段为整型或者是可以返回整型结果的表达式;
    --常规
    drop table if exists `hash_table`;
    create table `hash_table`(
    	`id` int,
    	`name` varchar(10)
    ) 
    partition by hash(id)
    partitions 3;
    --线性
    drop table if exists `hash_linear_table`;
    create table `hash_linear_table`(
    	`id` int,
    	`name` varchar(10)
    ) 
    partition by linear hash(id)
    partitions 3;

  4. key分区,类似于hash分区,只不过分区列不再强制为整型,可以为除text和BLOB两种类型外的其它类型。key分区分为常规key和线性key,常规key对分区字段采用的是MD5算法,线性key对分区字段采用的是二次方算法,类似hash分区在计算上的区别。
    -- 常规
    drop table if exists `key_table`;
    create table `key_table`(
    	`id` int,
    	`name` varchar(10) not null,
    	unique `uk_name` (name)
    ) 
    partition by key()
    partitions 3;
    -- 线性
    drop table if exists `key_table`;
    create table `key_table`(
    	`id` int,
    	`name` varchar(10) not null,
    	unique `uk_name` (name)
    ) 
    partition by linear key()
    partitions 3;
    

 指定分区查询

分区本身是SQL无关的,在增删查改的时候,我们不需要指定具体分区,MySQL会自动帮我们找到对应的分区,不过如果想查询某个分区,也可以指定,比如下面:

select * from range_table partition (p1);

### MySQL 分区表的概念与实现方法 #### 什么是分区? 在 MySQL 中,分区是一种将大表拆分为更小、更容易管理的部分的技术。通过分区,可以显著提高查询效率并简化数据维护工作。当 `have_partition_engine` 的值为 `YES`[^1],表示当前 MySQL 版本支持分区功能。 --- #### 分区的类型 MySQL 支持多种类型的分区方式,每种适用于不同的场景: 1. **Range 分区** 将数据按照某个字段范围分布到不同分区中。例如,可以根据日期或数值区间来划分。 ```sql CREATE TABLE sales ( id INT NOT NULL, sale_date DATE NOT NULL, amount DECIMAL(10,2) ) PARTITION BY RANGE (YEAR(sale_date)) ( PARTITION p0 VALUES LESS THAN (2020), PARTITION p1 VALUES LESS THAN (2021), PARTITION p2 VALUES LESS THAN MAXVALUE ); ``` 2. **List 分区** 类似于 Range 分区,但用于离散值集合而非连续范围。 ```sql CREATE TABLE employees ( emp_id INT NOT NULL, region VARCHAR(10) NOT NULL ) PARTITION BY LIST(region) ( PARTITION north VALUES IN ('North'), PARTITION south VALUES IN ('South'), PARTITION east VALUES IN ('East'), PARTITION west VALUES IN ('West') ); ``` 3. **Hash 分区** 使用哈希函数自动分配记录到指定数量的分区中。 ```sql CREATE TABLE logs ( log_id INT NOT NULL, message TEXT ) PARTITION BY HASH(log_id) PARTITIONS 4; ``` 4. **Key 分区** 类似 Hash 分区,但基于内置哈希算法。 ```sql CREATE TABLE users ( user_id INT NOT NULL, username VARCHAR(50) ) PARTITION BY KEY(user_id) PARTITIONS 8; ``` 5. **Composite 分区** 结合两种分区策略(如 Range 和 Hash),形成复合分区。 ```sql CREATE TABLE transactions ( trans_id INT NOT NULL, trans_date DATE NOT NULL ) PARTITION BY RANGE(YEAR(trans_date)) SUBPARTITION BY HASH(MONTH(trans_date)) SUBPARTITIONS 12 ( PARTITION p0 VALUES LESS THAN (2020), PARTITION p1 VALUES LESS THAN (2021), PARTITION p2 VALUES LESS THAN MAXVALUE ); ``` --- #### 如何管理分区? ##### 创建分区表 可以通过 `CREATE TABLE ... PARTITION BY` 语句定义分区逻辑。具体语法取决于所选的分区类型[^3]。 ##### 修改现有表的分区 如果已有表未启用分区,可通过 `ALTER TABLE` 添加分区: ```sql ALTER TABLE existing_table PARTITION BY RANGE (column_name) ( PARTITION p0 VALUES LESS THAN (value1), PARTITION p1 VALUES LESS THAN (value2), PARTITION pn VALUES LESS THAN MAXVALUE ); ``` ##### 删除分区 删除特定分区时,需注意其行为可能会影响数据重分配。例如: ```sql ALTER TABLE student DROP PARTITION student_2020; -- 此命令会将被删除分区数据重新分配至其他分区[^2] ``` ##### 合并分区 对于相邻的 Range 或 List 分区,可执行合并操作以减少碎片化: ```sql ALTER TABLE sales REORGANIZE PARTITION p0, p1 INTO ( PARTITION p_new VALUES LESS THAN (2021) ); ``` ##### 查看分区信息 使用以下 SQL 查询获取有关分区的元数据: ```sql SELECT * FROM INFORMATION_SCHEMA.PARTITIONS WHERE TABLE_NAME='your_table'; ``` --- #### 性能优化建议 1. 避免频繁更改分区结构,因为这可能导致锁表或其他性能开销。 2. 对于大数据量表,优先考虑按时间戳或业务属性进行分区。 3. 定期清理过期分区中的无用数据,释放存储空间。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xinqing5130

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值