文章目录
前言
一、MySQL事务
1、CURD不加控制,会有什么问题?
我们在学习Linux和C++时,知道了有些程序在并发场景下会出现问题。那么如果对MySQL数据库进行CURD操作时,如果不加以控制,也是会出现问题的。例如下面的一个案例。当客户端A判断tickets表中的nums值大于0后,还没有执行update语句。此时并发执行的客户端B也判断tickets表中的nums值大于0,然后客户端B执行update语句将nums减1,然后此时客户端A也将nums减1,这样的话就造成了同一张票被卖了两次的情况。我们在学习Linux时知道了产生线程安全的原因就是操作不是原子的,即在并发场景下,执行某个线程时还可以切换去执行另一个线程,这样就存在了线程安全问题。所以如果解决MySQL中的并发问题,也需要保证原子性。例如火车票案例中,想要保证数据库中的数据没有问题,那么就需要保证买票的过程是原子的,买票互相不能影响,买完票应该要永久有效,买前和买后都要是确定的状态。
2、什么是事务?
MySQL数据库为了解决客户端并发访问MySQL服务器产生的并发性问题,所以MySQL数据库产生了事务。
事务就是一组DML语句组成,这些语句在逻辑上存在相关性,这一组DML语句要么全部成功,要么全部失败,是一个整体。MySQL提供一种机制,保证我们达到这样的效果。事务还规定不同的客户端看到的数据是不相同的。
事务就是要做的或所做的事情,主要用于处理操作量大,复杂度高的数据。假设一种场景:你毕业了,学校的教务系统后台 MySQL 中,不在需要你的数据,要删除你的所有信息(一般不会) , 那么要删除你的基本信息(姓名,电话,籍贯等)的同时,也删除和你有关的其他信息,比如:你的各科成绩,你在校表现,甚至你在论坛发过的文章等。这样,就需要多条 MySQL 语句构成,那么所有这些操作合起来,就构成了一个事务。
正如我们上面所说,一个 MySQL 数据库,可不止你一个事务在运行,同一时刻,甚至有大量的请求被包装成事务,在向 MySQL 服务器发起事务处理请求。而每条事务至少一条 SQL语句,最多很多 SQL语句,这样如果大家都访问同样的表数据,在不加保护的情况,就绝对会出现问题。甚至,因为事务由多条 SQL 构成,那么,也会存在执行到一半出错或者不想再执行的情况,那么已经执行的怎么办呢?
所以,一个完整的事务,绝对不是简单的SQL语句集合,还需要满足如下四个属性:
- 原子性:一个事务(transaction)中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节。事务在执行过程中发生错误,会被回滚(Rollback)到事务开始前的状态,就像这个事务从来没有执行过一样。
- 一致性:在事务开始之前和事务结束以后,数据库的完整性没有被破坏。这表示写入的资料必须完全符合所有的预设规则,这包含资料的精确度、串联性以及后续数据库可以自发性地完成预定的工作。
- 隔离性:数据库允许多个并发事务同时对其数据进行读写和修改的能力,隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致。事务隔离分为不同级别,包括读未提交( Read uncommitted )、读提交( read committed )、可重复读( repeatable read )和串行化( Serializable )。
- 持久性:事务处理结束后,对数据的修改就是永久的,即便系统故障也不会丢失。
上面四个属性,可以简称为 ACID 。
原子性(Atomicity,或称不可分割性)
一致性(Consistency)
隔离性(Isolation,又称独立性)
持久性(Durability)。
MySQL中通过原子性、隔离性和持久性来保证其一致性,即只有满足了原子性、隔离性和持久性,才可以保证数据库一致性。
3、为什么会出现事务
事务被 MySQL 编写者设计出来,本质是为了当应用程序访问数据库的时候,事务能够简化我们的编程模型,不需要我们去考虑各种各样的潜在错误和并发问题。可以想一下当我们使用事务时,要么提交,要么回滚,我们不会去考虑网络异常了,服务器宕机了,同时更改一个数据怎么办。因此事务本质上是为了应用层服务的。而不是伴随着数据库系统天生就有的。
备注:我们后面把 MySQL 中的一行信息,称为一行记录。
4、事务的版本支持
在 MySQL 中只有使用了 Innodb 数据库引擎的数据库或表才支持事务, MyISAM 不支持。
下面我们来查看数据库引擎。我们看到只有InnoDB存储引擎支持事务。
show engines; --表格显示
show engines; --行显示
5、事务提交方式
事务的提交方式常见的有两种:
- 自动提交
- 手动提交
我们可以通过下面的语句来查看MySQL的事务提交方式。我们看到MySQL的提交方式为自动提交。
show variables like 'autocommit';
我们可以通过下面的语句来改变MySQL的事务自动提交模式。
//set autocommit=0 设置MySQL禁止事务自动提交
set autocommit=0;
//set autocommit=1 设置MySQL开启事务自动提交
set autocommit=1;
6、事务常见操作方式
我们前面学习知道了MySQL数据库分为客户端和服务端。一个MySQL的服务端是可以被多个客户端访问的。我们安装了MySQL数据库后,我们的主机中就会启动一个mysqld进程,这个进程就是MySQL数据库的服务器进程。而我们在Xshell中每开启一个终端登录MySQL数据库,就相当于创建了一个MySQL客户端。MySQL的客户端不一定是命令行形式的,还可以为图形化界面。
下面我们来演示事务的一些常见操作方式。为了便于演示,我们将MySQL的默认隔离级别设置为读未提交,因为MySQL数据库的默认隔离级别为可重复读。
我们看到当设置MySQL的默认隔离级别为读未提交后,并没有马上生效。此时需要先重启客户端,然后设置才能生效。
下面我们创建测试表。
正常演示 - 证明事务的开始与回滚
下面我们通过演示来体验事务的开始与回滚。
start transaction; //手动开始一个事务,begin也可以开始一个事务,推荐begin
begin; //手动开始一个事务
...
commit; //手动提交一个事务
savepoint save1; //创建一个保存点save1
rollback to save1; --回滚到保存点save1
rollback; --直接rollback,会回滚到这个事务最开始
下面我们并发执行两个MySQL客户端,然后让这两个客户端都手动开始一个事务。我们在客户端A中每插入一个数据之前就创建一个保存点。
下面我们回滚到保存点s3,可以看到此时客户端B查看account表中的数据时,id为3的数据没有了。
如果我们直接rollback,可以看到会回滚到这个事务开始的位置。
当我们将一个事务提交后再进行回滚,那么只会回滚到提交后的状态。即提交后的事务修改的数据就已经持久化在数据库中了。回滚只在事务执行期间可以回滚,当事务提交后,回滚就没有用了。
非正常演示
非正常演示1 - 证明未commit,客户端崩溃,MySQL自动会回滚(隔离级别设置为读未提交)
我们看到当终端A中的事务没有commit手动提交直接退出后,该事务修改的数据并没有被持久化。即当手动开始的事务没有手动commit提交事务时,如果客户端崩溃,那么MySQL会自动回滚到事务开始的位置。
非正常演示2 - 证明commit了,客户端崩溃,MySQL数据不会在受影响,已经持久化
我们看到当终端A中的事务commit手动提交后,终端如果因为异常而关闭了,那么MySQL会回滚到commit之后的位置。即在commit之前事务对数据做的修改被持久化到了数据库中。
非正常演示3 - 对比试验。证明begin操作会自动更改提交方式,不会受MySQL是否自动提交影响
上面我们演示时,虽然MySQL事务的自动提交是打开的,但是begin操作会自动更改提交方式为手动提交,所以自动提交不会生效。
下面我们将自动提交关闭。
然后我们做同样的测试,即让两个终端并发执行两个事务。然后终端A并没有commit手动提交事务,然后终端A异常退出,可以看到终端A的事务对数据库做的修改并没有持久化。
我们看到当commit手动提交事务后,终端A的事务对数据库做的修改就持久化了。
我们看到只有当使用commit进行手动提交后,事务修改的数据才会持久化。即我们就知道了无论是自动提交是否开启,当使用begin后,只有使用commit手动提交事务后,事务对数据库进行的修改才会持久化。这是因为当使用begin后,begin操作会自动更改提交方式为手动提交。
非正常演示4 - 证明单条 SQL 与事务的关系
下面我们将自动提交打开。
然后我们不使用begin,直接执行一句SQL语句,然后终端A异常退出,我们看到终端A的事务对数据库进行的修改持久化了。这是因为没有使用begin了,此时MySQL的默认事务提交方式为自动提交,所以当执行完一条SQL语句后就会将事务提交。
下面我们将事务自动提交关闭。但是我们使用commit手动提交事务了,那么事务对数据库的修改也是持久化的。因为上面的事务都只执行了一条SQL语句,所以我们可以证明了一条SQL语句也是一个事务。
结论
- 只要输入begin或者start transaction,事务便必须要通过commit提交,才会持久化,与是否设置set autocommit无关。
- 事务可以手动回滚,同时,当操作异常,MySQL会自动回滚。
对于 InnoDB 每一条 SQL 语言都默认封装成事务,自动提交。(select有特殊情况,因为MySQL 有 MVCC )
从上面的例子,我们能看到事务本身的原子性(回滚),持久性(commit)。
事务操作注意事项
- 如果没有设置保存点,也可以回滚,只能回滚到事务的开始。直接使用 rollback(前提是事务还没有提交)
- 如果一个事务被提交了(commit),则不可以回退(rollback)
- 可以选择回退到哪个保存点
- InnoDB 支持事务, MyISAM 不支持事务
- 开始事务可以使用 start transaction 或者 begin
7、事务隔离级别
如何理解隔离性
- MySQL服务可能会同时被多个客户端进程(线程)访问,访问的方式以事务方式进行。
- 一个事务可能由多条SQL构成,也就意味着,任何一个事务,都有执行前,执行中,执行后的阶段。而所谓的原子性,其实就是让用户层,要么看到执行前,要么看到执行后。执行中出现问题,可以随时回滚。所以单个事务,对用户表现出来的特性,就是原子性。
- 但毕竟所有事务都要有个执行过程,那么在多个事务各自执行多个SQL的时候,就还是有可能会出现互相影响的情况。比如:多个事务同时访问同一张表,甚至同一行数据。
- 就如同你妈妈给你说:你要么别学,要学就学到最好。至于你怎么学,中间有什么困难,你妈妈不关心。那么你的学习,对你妈妈来讲,就是原子的。那么你学习过程中,很容易受别人干扰,此时,就需要将你的学习隔离开,保证你的学习环境是健康的。
- 数据库中,为了保证事务执行过程中尽量不受干扰,就有了一个重要特征:隔离性
- 数据库中,允许事务受不同程度的干扰,就有了一种重要特征:隔离级别
隔离级别
- 读未提交【Read Uncommitted】: 在该隔离级别,所有的事务都可以看到其他事务没有提交的执行结果。(实际生产中不可能使用这种隔离级别的),但是相当于没有任何隔离性,也会有很多并发问题,如脏读,幻读,不可重复读等,我们上面为了做实验方便,用的就是这个隔离性。
- 读提交【Read Committed】 :该隔离级别是大多数数据库的默认的隔离级别(不是 MySQL 默认的)。它满足了隔离的简单定义:一个事务只能看到其他的已经提交的事务所做的改变。这种隔离级别会引起不可重复读,即一个事务执行时,如果多次 select, 可能得到不同的结果。
- 可重复读【Repeatable Read】: 这是 MySQL 默认的隔离级别,它确保同一个事务,在执行中,多次读取操作数据时,会看到同样的数据行。但是会有幻读问题。(可重复读级别。第一个终端通过事务改变了数据,并且需要提交。然后第二个终端结束掉自己的事务,再重新开始一个新事务,此时才可以看到数据的变化。即在两个终端的事务执行时,双方看不到对方的数据变化。)
- 串行化【Serializable】: 这是事务的最高隔离级别,它通过强制事务排序,使之不可能相互冲突,从而解决了幻读的问题。它在每个读的数据行上面加上共享锁,。但是可能会导致超时和锁竞争(这种隔离级别太极端,实际生产基本不使用)
隔离级别如何实现:隔离,基本都是通过锁实现的,不同的隔离级别,锁的使用是不同的。常见有,表锁,行锁,读锁,写锁,间隙锁(GAP),Next-Key锁(GAP+行锁)等。不过,我们目前现有这个认识就行,先关注上层使用。
查看与设置隔离性
下面为查看全局隔离级别。第一种为默认的设置,第二种会将第一种默认设置拷贝一份给这一次会话。第三种为第二种的简写。更改global会影响后续所有会话的设置,更改session只会影响这一次会话的设置。
下面为设置隔离级别。
-- 设置当前会话 or 全局隔离级别语法
SET [SESSION | GLOBAL] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | SERIALIZABLE}
下面为修改当前会话的隔离级别。我们看到当修改session的隔离级别后,默认的全局隔离级别没有变化,只有这一次会话的隔离级别变化了。并且我们看到另一个会话的配置没有被改变。
我们看到虽然将默认的全局隔离级别设置为串行化,但是当前会话的session隔离级别和另一个会话的session隔离级别并没有变化,这是因为此时虽然修改了默认的全局隔离级别,但是当前会话已经拷贝以前的默认全局隔离级别了,只有重新登录后,当前会话的session隔离级别才会和现在的全局隔离级别相同。
我们看到当重新登录mysql数据库后,此时当前会话的隔离级别就和现在的全局隔离级别相同了。
读未提交【Read Uncommitted】
下面我们将全局隔离级别设置为读未提交。需要注意,我们要重新登录,然后当前会话的隔离级别才会为读未提交。
然后我们在终端A和终端B启动两个事务,这两个事务在并发执行,我们看到终端B的事务读取到了终端A的事务还没有提交的数据,这就是读未提交,即多个并发执行的事务之间可以互相读取到并未提交的数据。这种现象其实就是脏读(一个事务在执行中,读到另一个执行中事务的更新(或其他操作)但是未commit的数据,这种现象叫做脏读dirty read)
读提交【Read Committed】
此时我们在终端A和终端B中并发执行两个事务,我们看到终端A的事务对account表做的修改如果没有提交的话,那么终端B的事务是看不到终端A的事务对account表做的修改的。
我们看到只有当终端A的事务提交后,终端B的事务才可以看到终端A的事务修改的数据。并且我们看到终端B的事务执行同一个select语句,出现了不同的结果,这种现象是不可重复读【同一个事务内,同样的读取,在不同的时间段(依旧还在事务操作中!),读取到了不同的值,这种现象叫做不可重复读(non reapeatable read)】。不可重复读是存在问题的,因为这个现象使同一个事务内,不同时间段执行的SQL语句得到了不同的结果,这肯定是不可以的。
可重复读【Repeatable Read】
可重复读隔离级别为MySQL默认的隔离级别,我们可以将MySQL服务器重启,然后查看MySQL默认的隔离级别是不是为可重复读。
我们看到MySQL默认的全局隔离级别为可重复读。
我们在终端A和终端B中并发执行两个事务,我们看到终端A的事务将修改的数据进行commit手动提交后,此时终端B的事务也没有看到终端A的事务修改的数据,这就是可重复读,即终端B的这个事务只要不执行commit手动提交,那么这个事务在任何时间段执行的同样的SQL语句得到的结果都是相同的。
我们将终端B的事务进行commit手动提交后,然后终端B的新的一个事务就可以查看到终端A对account表做修改的数据了。其它的数据库的可重复读隔离级别会存在一个幻读的现象。一般的数据库在可重复读情况的时候,无法屏蔽其他事务insert的数据(为什么?因为隔离性实现是对数据加锁完成的,而insert待插入的数据因为并不存在,那么一般加锁无法屏蔽这类问题),会造成虽然大部分内容是可重复读的,但是insert的数据在可重复读情况被读取出来,导致多次查找时,会多查找出来新的记录,就如同产生了幻觉。这种现象,叫做幻读(phantom read)。但是MySQL的隔离级别为可重复读的时候,是解决了幻读问题的(解决的方式是用Next-Key锁(GAP+行锁)解决的。
串行化【serializable】
修改默认全局隔离级别为串行化。
我们让终端A和终端B并发执行两个事务,然后我们让这两个事务读取表中数据,我们看到读取操作不会串行化,因为使用的共享锁。
但是当我们让终端A的事务执行delete语句删除表中数据时,可以看到终端A的事务卡在了那里。
当我们将终端B的事务进行commit手动提交后,终端A的事务才继续执行下去,这就是因为串行化中对所有操作全部加锁,所以同一时间只能有一个事务对表中数据进行修改,所以串行化的效率很低。我们还看到因为终端A的事务并没有commit手动提交,所以终端B的事务并不能看到终端A的事务对account表的数据做的修改。
我们看到隔离级别为串行化时,总是会出现一个事务在执行,另一个事务卡的情况。这就是串行化效率低的原因,因为对所有操作都进行加锁,所以同一时间只能有一个事务在执行。
当我们将终端A的事务进行commit手动提交后,然后终端B的事务就可以看到终端A的事务对account表的数据做的修改了。
下面的现象为串行化中的死锁现象。即终端A中的事务执行SQL语句后尝试提交事务,但此时需要锁定终端B以进行日志记录。同时终端B中的事务执行SQL语句后尝试提交事务,但此时需要锁定终端A以进行日志记录。由于终端A和终端B都在等待对方所持有的锁,导致了死锁的发生。这种情况下,MySQL会自动选择一个事务作为死锁牺牲者,并回滚该事务以解开死锁。更多死锁情况
总结
- 其中隔离级别越严格,安全性越高,但数据库的并发性能也就越低,往往需要在两者之间找一个平衡点。
- 不可重复读的重点是修改和删除:同样的条件, 你读取过的数据,再次读取出来发现值不一样了。
- 幻读的重点在于新增:同样的条件, 第1次和第2次读出来的记录数不一样。
- 说明: mysql 默认的隔离级别是可重复读,一般情况下不要修改
- 上面的例子可以看出,事务也有长短事务这样的概念。事务间互相影响,指的是事务在并行执行的时候,即都没有commit的时候,影响会比较大。
隔离级别 | 脏读 | 不可重复读 | 幻读 | 加锁读 |
---|---|---|---|---|
读未提交(read uncommited) | √ | √ | √ | 不加锁 |
读已提交(read commited) | × | √ | √ | 不加锁 |
可重复读(repeatable read) | × | × | × | 不加锁 |
可串行化(serializable) | × | × | × | 加锁 |
一致性(Consistency)
- 事务执行的结果,必须使数据库从一个一致性状态,变到另一个一致性状态。当数据库只包含事务成功提交的结果时,数据库处于一致性状态。如果系统运行发生中断,某个事务尚未完成而被迫中断,而改未完成的事务对数据库所做的修改已被写入数据库,此时数据库就处于一种不正确(不一致)的状态。因此一致性是通过原子性来保证的。
- 其实一致性和用户的业务逻辑强相关,一般MySQL提供技术支持,但是一致性还是要用户业务逻辑做支撑,也就是,一致性,是由用户决定的。
- 而技术上,通过AID保证C。