MySQL的事务和锁机制
一、事务的基本要素
https://dev.mysql.com/doc/refman/5.7/en/glossary.html#glos_acid
1、原子性(Atomicity):事务开始后所有操作,要么全部做完,要么全部不做,不可能停滞在中间环节。事务执行过程中出错,会回滚到事务开始前的状态,所有的操作就像没有发生一样。也就是说事务是一个不可分割的整体,就像化学中学过的原子,是物质构成的基本单位。
2、一致性(Consistency):事务开始前和结束后,数据库的完整性约束没有被破坏 。比如A向B转账,不可能A扣了钱,B却没收到。
3、隔离性(Isolation):同一时间,只允许一个事务请求同一数据,不同的事务之间彼此没有任何干扰。比如A正在从一张银行卡中取钱,在A取钱的过程结束前,B不能向这张卡转账。
4、持久性(Durability):事务完成后,事务对数据库的所有更新将被保存到数据库,不能回滚。
二、事务并发的问题
参考到文档 https://developer.aliyun.com/article/743691 里面的示意图画的非常好
1、脏读:事务A读取了事务B更新的数据,然后B回滚操作,那么A读取到的数据是脏数据
会话B开启一个事务,把id=1的name为武汉市修改成温州市,此时另外一个会话A也开启一个事务,读取id=1的name,此时的查询结果为温州市,会话B的事务最后回滚了刚才修改的记录,这样会话A读到的数据是不存在的,这个现象就是脏读。(脏读只在读未提交(READ-UNCOMMITED)隔离级别才会出现)
口诀: B更A读B回滚,A读出来的数据么得了
2、不可重复读:事务 A 多次读取同一数据,事务 B 在事务A多次读取的过程中,对数据作了更新并提交,导致事务A多次读取同一数据时,结果不一致。
一个事务只能读到另一个已经提交的事务修改过的数据,并且其他事务每对该数据进行一次修改并提交后,该事务都能查询得到最新值。(不可重复读在读未提交和读已提交隔离级别都可能会出现)
会话A开启一个事务,查询id=1的结果,此时查询的结果name为武汉市。接着会话B把id=1的name修改为温州市(隐式事务,因为此时的autocommit为1,每条SQL语句执行完自动提交),此时会话A的事务再一次查询id=1的结果,读取的结果name为温州市。会话B再此修改id=1的name为杭州市,会话A的事务再次查询id=1,结果name的值为杭州市,这种现象就是不可重复读。
口诀: A读B更A再读B再更,A读多次不一致
3、幻读:系统管理员A将数据库中所有学生的成绩从具体分数改为ABCDE等级,但是系统管理员B就在这个时候插入了一条具体分数的记录,当系统管理员A改结束后发现还有一条记录没有改过来,就好像发生了幻觉一样,这就叫幻读。
事务A执行一次查询,然后事务B新插入一行记录,这行记录恰好可以满足A所使用的查询的条件。然后 A又使用相同的查询再次对表进行检索,但此时却看到了事务B刚才插入的新行。这个新行就称为“幻像”,因为对A来说这一行就像突然出现的一样。
会话A开启一个事务,查询id>0的记录,此时会查到name=武汉市的记录。接着会话B插入一条name=温州市的数据(隐式事务,因为此时的autocommit为1,每条SQL语句执行完自动提交),这时会话A的事务再以刚才的查询条件(id>0)再一次查询,此时会出现两条记录(name为武汉市和温州市的记录),这种现象就是幻读。
口诀: A读B插入,A再读,多了
小结:不可重复读的和幻读很容易混淆,不可重复读侧重于修改,幻读侧重于新增或删除。解决不可重复读的问题只需锁住满足条件的行,解决幻读需要锁表
三、MySQL事务隔离级别
文档在这里 https://dev.mysql.com/doc/refman/5.7/en/innodb-transaction-isolation-levels.html
InnoDB
offers all four transaction isolation levels described by the SQL:1992 standard:READ UNCOMMITTED
,READ COMMITTED
,REPEATABLE READ
, andSERIALIZABLE
. The default isolation level forInnoDB
isREPEATABLE READ
.
InnoDB默认的事务隔离级别是 repeatable-read
- 可重复读(repeatable-read):
这是MySQL的默认事务隔离级别。在一个事务当中第一次读会建立一个全库snapshot,同事务下的select语句会读取这个snapshot来实现一致性非锁定读。而第一个snapshot的建立猜测与READ COMMITTED下的读取机制一样。同事务的select语句会读取这个snapshot的数据来实现一致性非锁定读,这个snapshot是针对整个数据库中所有支持MVCC机制的表的,即在snapshot建立后读取任意其他表都只会读取到snapshot中的快照数据,示例如下:
时刻一,A会话执行:select * from T2 where id=1;
时刻二,A会话执行:start transaction; select * from T1; --snapshot建立
时刻三,B会话执行:针对T1表和T2表的DML语句修改数据
时刻四,A会话执行:select * from T1; --发现读到的数据与时刻二一模一样,证明表T1实现了一致性读
时刻五,A会话执行:select * from T2 where id=1; --发现读到的数据与时刻一一致,证明snapshot非表级,而是库级
这种隔离级别下可以避免脏读、不可重复读和幻读。
对于select for update/select lock in share mode/update/delete这些锁定读,加行锁模式取决于索引的类型:
- 对唯一索引的访问只会添加record lock,而不会使用gap lock(即也没有next-key lock)。
- 对非唯一索引的访问使用gap lock或者next-key lock,如果访问的记录不存在就是gap lock,否则就是next-key lock。
在可重复读隔离级别下,事务B只能在事务A修改过数据并提交后,自己也提交事务后,才能读取到事务B修改的数据。
可重复读隔离级别解决了脏读和不可重复读的问题,但可能发生幻读问题。
提问:为什么上了写锁(写操作),别的事务还可以读操作?
因为InnoDB有MVCC机制(多版本并发控制),可以使用快照读,而不会被阻塞。
- 读已提交(read-commited):每个一致的读取,即使在相同的事务中,也可以设置并读取自己的新快照。
在读已提交隔离级别下,事务B只能在事务A修改过并且已提交后才能读取到事务B修改的数据。
读已提交隔离级别解决了脏读的问题,但可能发生不可重复读和幻读问题,一般很少使用此隔离级别。
- 读未提交(read-uncommitted)
这种隔离级别下普通select语句是不加事务锁的,因此会产生脏读,这种事务隔离级别是应当完全避免的。除select语句以外的其他语句加锁模式与READ COMMITTED一样。
在读未提交隔离级别下,事务A可以读取到事务B修改过但未提交的数据。可能发生脏读、不可重复读和幻读问题,一般很少使用此隔离级别
- 串行化(serializable)
这种事务隔离级下select语句即便不加lock in share mode也使用lock_mode=S的行锁,select自成事务,锁直到事务结束才释放。
这种隔离级别下可以避免脏读、不可重复读和幻读。
DML语句的加锁模式与REPEATABLE READ一样。
官网对于这个隔离级别的解释是只有将autocommit设置为0后select才会被隐式转换为lock in share mode的加锁模式,但是经测验发现在此模式下只要为select语句开启事务就会阻塞其他事物的更改,因此官网解释应该有误。
事务隔离级别 | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
读未提交(read-uncommitted) | 是 | 是 | 是 |
读已提交(read-committed) | 否 | 是 | 是 |
可重复读(repeatable-read) | 否 | 否 | InnoDB不会出现 |
串行化(serializable) | 否 | 否 | 否 |
事务隔离级别的解决方案
- 当前读,在读取数据前,对其加锁,阻止其他事务对数据进行修改。Lock Based Concurrency Control (LBCC)
- 快照读:生成请求数据时间点的一致性数据快照,并用这个快照来提供一定级别的一致性读取。 Multi Version Concurrency Controller (MVCC)