UUID 不适合索引的核心原因

最新推荐文章于 2025-07-24 20:37:37 发布

原创最新推荐文章于 2025-07-24 20:37:37 发布 · 516 阅读

CC 4.0 BY-SA版权

文章标签：

UUID（通用唯一识别码）虽然能保证全局唯一性，但在数据库索引中使用时存在明显的性能缺陷。以下是具体原因和替代方案：

示例：对比自增ID（按顺序插入）和UUID（随机插入）的索引结构差异：

自增ID索引：1 → 2 → 3 → 4 → 5 （连续紧凑）
UUID索引： 3A7F → 1B2C → 8D4E → 0F9A （分散碎片化）

占用字节多：UUID为16字节（128位），而自增ID（如BIGINT）仅8字节。更大的索引键导致：
- 索引树层级更深，查询时需要更多磁盘I/O。
- 内存中缓存的索引条目更少，降低缓存命中率。

PostgreSQL：使用uuid-ossp扩展的uuid_generate_v7()函数。
MySQL：将UUID存储为BINARY(16)而非CHAR(36)，节省空间（如UNHEX(REPLACE(UUID(), '-', ''))）。

指标	自增ID (BIGINT)	随机UUID (v4)	有序UUID (v7)
索引大小	小（8字节）	大（16字节）	中（16字节）
写入吞吐量	高	低（碎片化）	中
范围查询效率	高	低	高
分布式适用性	否	是	是

UUID的随机性是其作为索引的最大缺陷，但在分布式场景中难以完全避免。优先选择有序UUID（如v7或ULID），或通过数据库优化手段缓解性能问题。对于单机高并发系统，自增ID仍是索引的最佳选择。