逻辑存储结构
表空间
表空间是
InnoDB
存储引擎逻辑结构的最高层, 如果用户启用了参数
innodb_file_per_table(
在
8.0
版本中默认开启
)
,则每张表都会有一个表空间(
xxx.ibd
),一个
mysql
实例可以对应多个表空
间,用于存储记录、索引等数据。
段
段,分为数据段(
Leaf node segment
)、索引段(
Non-leaf node segment
)、回滚段 (Rollback segment
),
InnoDB
是索引组织表,数据段就是
B+
树的叶子节点, 索引段即为
B+
树的非叶子节点。段用来管理多个Extent
(区)。
区
区,表空间的单元结构,每个区的大小为
1M
。 默认情况下,
InnoDB
存储引擎页大小为
16K
, 即一 个区中一共有64
个连续的页。
页
页,是
InnoDB
存储引擎磁盘管理的最小单元,每个页的大小默认为
16KB
。为了保证页的连续性, InnoDB 存储引擎每次从磁盘申请
4-5
个区。
行
行,InnoDB 存储引擎数据是按行进行存放的。
在行中,默认有两个隐藏字段:
Trx_id:每次对某条记录进行改动时,都会把对应的事务id赋值给trx_id隐藏列。
Roll_pointer
:每次对某条引记录进行改动时,都会把旧的版本写入到
undo
日志中,然后这个
隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
结构
内存结构
磁盘结构
事务原理
redo log
重做日志,记录的是事务提交时数据页的物理修改,是用来实现事务的持久性该日志文件由两部分组成:重做日志缓冲(redo log buffer)以及重做日志文件(redo log file),前者是在内存中,后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用。
如果没有
redolog
,可能会存在什么问题的? 我们一起来分析一下。
我们知道,在
InnoDB
引擎中的内存结构中,主要的内存区域就是缓冲池,在缓冲池中缓存了很多的数据页。 当我们在一个事务中,执行多个增删改的操作时,InnoDB
引擎会先操作缓冲池中的数据,如果缓冲区没有对应的数据,会通过后台线程将磁盘中的数据加载出来,存放在缓冲区中,然后将缓冲池中的数据修改,修改后的数据页我们称为脏页。 而脏页则会在一定的时机,通过后台线程刷新到磁盘中,从而保证缓冲区与磁盘的数据一致。 而缓冲区的脏页数据并不是实时刷新的,而是一段时间之后将缓冲区的数据刷新到磁盘中,假如刷新到磁盘的过程出错了,而提示给用户事务提交成功,而数据却没有持久化下来,这就出现问题了,没有保证事务的持久性。

那么,如何解决上述的问题呢? 在
InnoDB
中提供了一份日志
redo log
,接下来我们再来分析一
下,通过redolog如何解决这个问题。

有了
redolog
之后,当对缓冲区的数据进行增删改之后,会首先将操作的数据页的变化,记录在
redo log buffer中。在事务提交时,会将
redo log buffer
中的数据刷新到
redo log
磁盘文件中。
过一段时间之后,如果刷新缓冲区的脏页到磁盘时,发生错误,此时就可以借助于
redo log
进行数据 恢复,这样就保证了事务的持久性。 而如