MySQL InnoDB 引擎中的聚簇索引和非聚簇索引有什么区别？

最新推荐文章于 2025-07-20 19:06:57 发布

篱笆院的狗

最新推荐文章于 2025-07-20 19:06:57 发布

阅读量381

点赞数 11

CC 4.0 BY-SA版权

分类专栏：后端经典面试题文章标签： mysql 数据库

本文链接：https://blog.csdn.net/guochuanlin1/article/details/145898947

后端经典面试题专栏收录该内容

3 篇文章

订阅专栏

在 MySQL 的 InnoDB 存储引擎中，聚簇索引（Clustered Index）和非聚簇索引（Non-Clustered Index）是两种重要的索引类型，它们在数据存储结构、性能特点和适用场景上存在显著区别。以下是对它们的详细对比和解释：

1.数据存储结构

(1)聚簇索引（Clustered Index）

• 定义：聚簇索引是按照索引键的顺序存储数据行的索引。也就是说，表的数据行本身是按照聚簇索引的顺序存储的。

• 存储方式：在 InnoDB 中，聚簇索引的叶子节点直接存储完整的数据行。因此，聚簇索引的顺序决定了表中数据的物理存储顺序。

• 主键与聚簇索引：在 InnoDB 中，主键默认就是聚簇索引。如果没有显式定义主键，InnoDB 会选择第一个非空的唯一索引作为聚簇索引。如果连唯一索引都没有，InnoDB 会自动生成一个隐藏的聚簇索引。

(2)非聚簇索引（Non-Clustered Index）

• 定义：非聚簇索引是与表数据行分开存储的索引。它的叶子节点不存储完整的数据行，而是存储数据行的引用（通常是聚簇索引键或行指针）。

• 存储方式：非聚簇索引的叶子节点包含索引键和指向实际数据行的指针。当通过非聚簇索引查询时，通常需要两次查找：先在非聚簇索引中找到指针，再通过指针回表查找实际数据行。

2.性能特点

(1)查询性能

• 聚簇索引：

• 优点：对于范围查询（如BETWEEN、>、<）和基于聚簇索引键的查询，性能非常高，因为数据已经按照索引顺序存储，无需额外的排序或多次查找。

• 缺点：如果查询列不包含聚簇索引键，则可能需要回表查询，增加 I/O 开销。

• 非聚簇索引：

• 优点：可以为表中的其他列提供快速访问路径，尤其是当这些列不适合作为聚簇索引时。

• 缺点：查询时通常需要回表操作（除非是覆盖索引），增加了 I/O 次数。

(2)插入和更新性能

• 聚簇索引：

• 插入性能：插入数据时，InnoDB 会根据聚簇索引的顺序将数据插入到合适的位置。如果插入顺序与索引顺序不一致，可能会导致页分裂，影响性能。

• 更新性能：更新聚簇索引键的值可能导致数据行的物理移动，因为数据的存储顺序需要保持与索引顺序一致。

• 非聚簇索引：

• 插入性能：插入数据时，非聚簇索引的维护成本相对较低，因为其叶子节点仅存储索引键和指针。

• 更新性能：更新非聚簇索引键的值时，仅需要更新索引结构，无需移动数据行。

3.使用场景

(1)聚簇索引

• 适用场景：

• 主键查询：如果查询主要基于主键，聚簇索引可以提供最快的访问速度。

• 范围查询：对于需要按顺序访问大量数据的查询（如ORDER BY、GROUP BY），聚簇索引非常高效。

• 数据完整性：聚簇索引的顺序存储特性可以避免数据碎片化，适合需要频繁读取的场景。

(2)非聚簇索引

• 适用场景：

• 非主键列的查询：如果查询主要基于非主键列，非聚簇索引可以提供快速的访问路径。

• 覆盖索引：当查询的所有列都包含在非聚簇索引中时，可以直接从索引中获取数据，避免回表操作。

• 辅助查询：用于优化排序、分组等操作，尤其是当这些列不适合作为聚簇索引时。

4.示例

假设有一个表employees，包含以下列：

CREATE TABLE employees (
    id INT AUTO_INCREMENT PRIMARY KEY,
    name VARCHAR(50),
    department VARCHAR(50),
    salary INT
) ENGINE=InnoDB;

• 聚簇索引：id是主键，也是聚簇索引。数据行按照id的顺序存储。

• 非聚簇索引：为department列创建一个非聚簇索引：

  CREATE INDEX idx_department ON employees (department);

查询示例

• 聚簇索引查询：

   SELECT * FROM employees WHERE id = 123;

• 直接通过聚簇索引访问数据行，无需回表。

• 非聚簇索引查询：

   SELECT * FROM employees WHERE department = 'Sales';

• 首先在非聚簇索引中找到department = 'Sales'的记录，然后通过指针回表获取完整数据。

• 覆盖索引查询：

   SELECT department, salary FROM employees WHERE department = 'Sales';

• 如果查询的列都在非聚簇索引中，则可以直接从索引中获取数据，无需回表。

5.总结

• 聚簇索引：

• 数据行存储在索引中，顺序与索引键一致。

• 适合主键查询和范围查询。

• 插入和更新可能涉及数据行的物理移动。

• 非聚簇索引：

• 索引与数据行分开存储，叶子节点包含指针。

• 适合非主键列的查询，尤其是覆盖索引。

• 维护成本较低，但可能需要回表操作。

在设计数据库时，合理选择和使用聚簇索引和非聚簇索引可以显著提升查询性能和数据管理效率。