写点什么

MySQL 锁系统总结

  • 2021-03-26
  • 本文字数:6898 字

    阅读完需:约 23 分钟

MySQL锁系统总结

innoDB 锁简介

innoDb 支持多种粒度的锁,按照粒度来分,可分为表锁(LOCK_TABLE)行锁(LOCK_REC)

一般的锁系统都会有共享锁排他锁的分类,共享锁也叫读锁排他锁也叫写锁。加在同一个资源上,写锁会阻塞另外一把写锁或读锁的获取,读锁则允许另外一把读锁的获取,也就是读读之间允许并发,读写或者写写会阻塞,innodb 中表锁和行锁都支持共享锁(简写S)排他锁(简写X)


因为 innoDB 支持多粒度的锁,允许表锁和行锁的并存,为了方便多粒度锁冲突的判断,innoDB 中还存在一种名叫意向锁(Intention Locks)的锁。


除此之外,还有一种特殊的表锁,自增锁,主要用来并发安全的生成自增 id,一种特殊的意向锁,插入意向锁,用来防止幻读问题

表锁

表锁,锁定的粒度是整个表,也分共享锁和排他锁。不同于行锁,表锁 MySQL Server 层就有实现(所以 MyISAM 支持表锁,也只支持表锁),innoDb 则在存储引擎层面也实现了一遍表锁(后面会介绍具体结构)。


哪些时候会触发表锁呢?在执行某些 ddl 时,比如alter table等操作,会对整个表加锁,也可以手动执行锁表语句:LOCK TALBES table_name [READ | WRITE],READ 为共享锁,WRITE 为排他锁,手动解锁的语句为:UNLOCK TABLES,会直接释放当前会话持有的所有表锁

有一些需要注意的地方:


  • 因为 MySQL Server 层和 InnoDB 都实现了表锁,仅当autocommit=0innodb_table_lock=1(默认设置)时,InnoDB 层才能知道 MySQL 加的表锁,MySQL Server 才能感知 InnoDB 加的行锁,这种情况下,InnoDB 才能自动识别涉及表级锁的死锁,否则,InnoDB 将无法自动检测并处理这种死锁

  • 在用LOCK TALBES显式获取锁后,只能访问加锁的这些表,并且如果加的是共享锁,那么只能执行查询操作,而不能执行更新操作,如果获得的是排他锁,则可以进行更新操作。

  • 开始事务时会自动 UNLOCK 之前的表锁,COMMIT 或 ROLLBACK 都不能释放用LOCK TABLES加的表级锁。LOCK TALBES时会先隐式提交事务,再锁表,UNLOCK TALBES也会隐式提交事务。所以,事务中需要的表锁必须在事务开头一次性获取,无法再事务中间获取,因为不管是LOCK TALBES还是UNLOCK TALBES都会提交事务


官网上建议的表锁的使用方法:


SET autocommit=0;LOCK TABLES t1 WRITE, t2 READ, ...;... do something with tables t1 and t2 here ...COMMIT;UNLOCK TABLES;
复制代码


实际业务中,没有特殊理由,不建议使用表锁,因为锁的粒度太大了,极大的影响并发。

意向锁

意向锁是一种特殊的表级锁,意向锁是为了让 InnoDB 多粒度的锁能共存而设计的。取得行的共享锁和排他锁之前需要先取得表的意向共享锁(IS)和意向排他锁(IX),意向共享锁和意向排他锁都是系统自动添加和自动释放的,整个过程无需人工干预。 主要是用来辅助表级和行级锁的冲突判断,因为 Innodb 支持行级锁,如果没有意向锁,则判断表锁和行锁冲突的时候需要遍历表上所有行锁,有了意向锁,则只要判断表是否存在意向锁就可以知道是否有行锁了。表级别锁的兼容性如下表:



图片可以看到,意向锁与意向锁兼容,IX、IS 自身以及相互都兼容,不互斥,因为意向锁仅表示下一层级加什么类型的锁,不代表当前层加什么类型的锁;IX 和表级 X、S 互斥;IS 和表级 X 锁互斥。其兼容性正好体现了其作用。

自增锁

自增锁是一种特殊的表级别锁,如果一个表的某个行具有 AUTO_INCREMENT 的列,则一个事务在插入记录到这个表的时候,会先获取自增锁。如果一个事务持有自增锁,会阻塞其他事物对该表的插入操作,保证自增连续。innodb_autoinc_lock_mode 变量定义了不同的自增算法,在 MySql8.0 之前默认值是 1,MySql8.0 之后默认值是 2,具体区别参考官方文档(https://dev.mysql.com/doc/refman/8.0/en/innodb-auto-increment-handling.html)

行锁

Innodb 中的行锁种类繁多,可以分为:记录锁(record locks)、间隙锁(gap locks)、临键锁(next-key locks),插入意向锁(insert intention locks)。行锁在逻辑上都可以看作作用于索引或者索引间隙之上,索引分为主键索引和非主键索引两种,如果一条 sql 语句操作了主键索引,MySQL 就会锁定这条主键索引;如果一条语句操作了非主键索引,MySQL 会先锁定该非主键索引,再锁定相关的主键索引。


很多语句都会加行锁,比如 Update、Delete、Insert 等操作,或者使用 SELECT ... FOR SHARE | UPDATE [NOWAIT |SKIP LOCKED]来进行当前读(Locking Reads),其中 SHARE 表示加共享锁,UPDATE 表示加排他锁。当要加的锁与当前行已有锁互斥时,会一直阻塞等待一段时间(innodb_lock_wait_timeout 定义了等待时间)。加上 NOWAIT 参数则不会阻塞,会立即返回,并显示一个错误,加上 SKIP LOCKED 则会在结果集中跳过这些冲突的记录(慎用)。


在不同的语句,不同的事务隔离级别下,甚至不同的索引类型下,行锁会表现成不同的形式,下面介绍这些形式:

记录锁(record locks)

在逻辑上,记录锁可以理解为锁定的是某个具体的索引,当 SQL 执行按照唯一性(Primary key、Unique key)索引进行数据的检索时,查询条件等值匹配且查询的数据是存在,这时 SQL 语句加上的锁即为记录锁。

图片间隙锁(gap locks)


在逻辑上,间隙锁可以理解为锁住的是索引之间的间隙,是一个左开右开的区间。当 SQL 执行按照索引进行数据的检索时,查询条件的数据不存在,这时 SQL 语句加上的锁即为间隙锁。


图片如上图,因为这些语句查询的值都不存在,所以锁住的都是间隙。并且在 InnoDb 存储引擎里,每个数据页中都会有两个虚拟的行记录,用来限定记录的边界,分别是:Infimum Record 和 Supremum Record,Infimum 是比该页中任何记录都要小的值,而 Supremum 比该页中最大的记录值还要大,这两条记录在创建页的时候就有了,并且不会删除。所以当查询的值比当前已有记录最大值还大时候,锁住的会是最大值到 Supremum 之间的间隙。比如第一条语句,查询的时候就算是等值匹配,只要这个不存在的数据落在两个索引节点之间,就算不是一个范围,也会锁住索引节点间的所有数据即 gap3,范围(7,11)。


间隙锁是可以共存的,共享间隙锁与独占间隙锁之间是没有区别的,两者之间并不冲突。其存在的目的都是防止其他事务往间隙中插入新的纪录,故而一个事务所采取的间隙锁是不会去阻止另外一个事务在同一个间隙中加锁的


间隙锁是设计用来防止幻读的,当锁定一个 gap 时,其他事务没有办法再往这个 gap 中插入数据,PostgreSQL 没有这种机制,所以 PostgreSQl 没有办法锁住不存在的行,无法防止幻读

临键锁(next-key locks)

在逻辑上,临键锁可以理解为锁住的是索引本身以及索引之前的间隙,是一个左开右闭的区间。当 SQL 执行按照非唯一索引进行数据的检索时,会给匹配到行上加上临键锁。


图片如上图,当执行 select * from table_name where id = 3 for update 时会锁定(-∞,3)区间,因为按照这个 SQL 的语义,即是为了锁住 id=3 的数据,不允许其他操作,如果只是锁住记录本身,肯定是没有办法保证的,因为这是非唯一索引,还有可能插入其他 id=3 的数据,如果把间隙都给锁住,则其他对这个间隙的插入操作都会被阻塞,从而保证了一致性,这也是临键锁的用意。


如果加锁时,查询条件没有命中索引(非 ICP 的查询),则 InnoDB 会尝试给全表每一条记录都加上临键锁,效果相当于锁表了

插入意向锁(insert intention locks)

插入意向锁是一种间隙锁形式的意向锁,在真正执行 INSERT 操作之前设置。当执行插入操作时,总会检查当前插入操作的下一条记录(已存在的主索引节点)上是否存在锁对象,判断是否锁住了 gap,如果锁住了,则判定和插入意向锁冲突,当前插入操作就需要等待,也就是配合上面的间隙锁或者临键锁一起防止了幻读操作。 因为插入意向锁是一种意向锁,意向锁只是表示一种意象,所以插入意向锁之间不会互相冲突,多个插入操作同时插入同一个 gap 时,无需互相等待,比如当前索引上有记录 4 和 8,两个并发 session 同时插入记录 6,7。他们会分别为(4,8)加上 GAP 锁,但相互之间并不冲突。


INSERT 语句在执行插入之前,会先在 gap 中加入插入意向锁,如果是唯一索引,还会进行 Duplicate Key 判断,如果存在相同 Key 且该 Key 被加了互持锁,则还会加共享锁,然后等待(因为这个相同的 Key 之后有可能会回滚删除,这里非常容易死锁)。等到成功插入后,会在这条记录上加排他记录锁。

行锁小结

行锁在不同的语句中和环境条件下可以表现成:记录锁(record locks)、 间隙锁(gap locks)、临键锁(next-key locks)和插入意向锁(insert intention locks)。记录锁锁住具体的记录,间隙锁锁住记录之间的间隙,临键锁锁住记录和记录前面的间隙,插入意向锁则是特殊的间隙锁,在插入前判断行将要插入的间隙是否会有冲突。


以上说的各种行锁的加锁情况都是在可重复读(REPEATABLE READ)隔离级别下,这个级别也是 innoDB 默认的事务隔离级别,是最常用的隔离级别,但是其实不同语句在不同隔离级别下加锁的情况会有非常大的区别,以下会简单说明。

不同语句和隔离级别对加锁的影响

这里先排除读未提交(READ UNCOMMITTED)这种隔离级别的情况,这种级别在生产上几乎无法使用,会出现脏读的情况,不一致读,无法保证事务的 ACID。然后先看下串行化(SERIALIZABLE)隔离级别。


串行化隔离级别和可重复读隔离级别最大的区别应该是,innoDB 会隐式的转换所有的 SELECT 语句,给其加共享锁,变成 SELECT ... FOR SHARE,这样读操作会阻塞其他写操作,使得读写无法并发,只能串行,从而保证严格的一致性。不过这种行为也受到 autocommit 变量的影响:


如果禁用了 autocommit,如上所述,则 innoDB 会隐式的转换所有的 SELECT 语句,给其加共享锁


如果开启了 autocommit,不会进行隐式转换,因为每条语句构成一个事务,所有快照读语句(也就是没有 FOR UPDATE|SHARE 的 SELECT 语句)可以被认为是只读的事务,是可以安全并发,不需要阻塞其他事务


不可重复读(READ COMMITTED)隔离级别下,和可重复读隔离级别在行锁方面主要的区别是:


不可重复读隔离级别下取消了间隙锁,临键锁也退化成了记录锁。间隙锁定和临键锁仅用于外键约束检查和重复键检查,也就是说加锁时,如果没有符号条件的查询并不加锁,有符合条件的查询也只会给记录加上记录锁。因为没有了间隙锁,所以会出现幻读问题。


在可重复读隔离级别下,加锁时如果查询条件没有命中索引(非 ICP 的查询),则会给表中每条记录都加上临键锁。而不可重复读隔离级别下因为没有间隙锁,则会退化成给表中每条数据加上记录锁,并且还会把没有匹配的行上的锁给释放掉,而不是把全表所有记录不管有没有匹配都给锁上。


7 死锁因为使用表锁时,需要一次性申请所有所需表的锁,所以在只使用表锁的情况下不会出现死锁,一般出现死锁的情况都是行锁。innoDB 有死锁探测机制,在申请锁的时候,都会先进行死锁判断,采用的算法深度优先搜索,并且如果在搜索过程中发现有环,就说明发生了死锁,为了避免死锁检测开销过大,如果搜索深度超过了 200(LOCK_MAX_DEPTH_IN_DEADLOCK_CHECK)也同样认为发生了死锁。出现死锁时,innoDB 会选择一个回滚代价比较小的事务进行回滚。以下会举几个比较典型的死锁例子(均在可重复度隔离级别下),首先会先建一张测试的表:


CREATE TABLE `student` (`id` int NOT NULL,`uuid` varchar(64) NOT NULL,`name` varchar(64) NOT NULL,`age` int NOT NULL,PRIMARY KEY (`id`),UNIQUE KEY `uuid_index` (`uuid`),KEY `name_index` (`name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci
复制代码

死锁例一

语句顺序\事务事务一事务二
T1begin;begin;
T2select * from student where id = 1  for update;select * from student where id = 2 for update;
T3select * from student where id = 2  for update;
T4(死锁发生)
select * from student where id = 1 for update;


这是最简单最典型的死锁的情况了,两个事务互相锁定持有资源,并且等待对方的资源,最后形成一个环,死锁出现。最后某个事务回滚,写业务代码的时候,应该对并发条件可能出现这种情况的语句有所警觉。

死锁例二


前提:事务开始时,student 表里有 id=1 的记录



语句顺序\事务
事务一事务二
T1begin;begin;
T2select * from student where id = 1  for share;select * from student where id = 1 for share;
T3update student set name = 'Tom' where id = 1;
T4(死锁发生)
update student set name = 'Jack' where id = 1;


死锁例三

前提:事务开始时,student 表里没有 id=100 的记录



语句顺序\事务
事务一事务二
T1begin;begin;
T2select * from student where id = 100 for update;select * from student where id = 100 for update;
T3insert into student values (100, 'uuid100', 'jack', 18);
T4(死锁发生)
insert into student values (100, 'uuid100', 'jack', 18);

死锁例四


前提:事务开始时,student 表里没有 uuid=uuid100 的记录



语句顺序\事务
事务一事务二事务三
T1begin;begin;begin;
T2insert into student values (100, 'uuid100', 'jack', 18);

T3
insert into student values (101, 'uuid100', 'jack', 18);insert into student values (102, 'uuid100', 'jack', 18);
T4(死锁发生)rollback;


这也是 MySql 官方文档给出的一个例子。三个事务同时插入一条某个唯一索引属性(上面的 uuid)相同的数据,其中某个事务先一步插入,其他两个事务会阻塞等待,然后先一步插入的事务回滚,其他两个事务出现死锁,其中某个事务会被回滚。官方文档还提到了另外一种类似的情况,具体可以参考 Locks Set by Different SQL Statements in InnoDB


这种死锁的原因是,INSERT 的时候,会对唯一索引进行 Duplicate Key 判断,如果唯一键冲突,则会加共享锁等待,也就是 T3 时候的事务二和事务三,都会获得共享锁。T4 时,事务一回滚,事务二和事务三都会申请升级排他锁,这样就造成类似死锁案例二的情况,形成死锁了。

死锁例五



语句顺序\事务
事务一事务二
T1begin;begin;
T2(死锁发生)update student set age = age + 1 where name = 'jack';update student set name = 'bob' where id > 100;

死锁小结

使用 SHOW ENGINE INNODB STATUS 语句可以看到最近一次的死锁信息,在调试的时候很有帮助。


出现死锁后某个事务会回滚,其他事务成功,上层业务会捕获到死锁错误,再重试一般会成功,如果出现大量锁重试,则说明哪里出了问题,写代码的时候可以注意以下几点可以减少死锁出现的概率:


  • 类似的业务逻辑尽量以固定的顺序访问表和行

  • 如果业务允许,大事务拆小,大事务持有锁的时间更长,更容易出现死锁

  • 为表添加合理的索引,可以看到可重复读级别下,如果不走索引(非 ICP 的查询)将会为表的每一行记录加锁

  • 尽量少用 for share 或者 for update 语句,虽然看起来只是在一行记录上加锁,但是由于间隙锁和临键锁的存在,锁住的可能不止是一行记录

  • 提前申请足够强度的锁,不要先用 for share 锁住行,后面再 update,很容易死锁。

锁的内部表示

innoDb内部中,用unsigned long类型表示锁的类型,其中不同的位代表锁不同的信息,最低的 4 位表示 lock_mode,中间的 4 位表示 lock_type,其余高位表示 record_lock_type,内部使用位操作来设置和判断是否设置了对应的值 :


| record_lock_type | lock_type  | lock_mode | --- | --- | ---

lock_mode:描述了锁的基本类型,分为以下几种


  • LOCK_IS: 意向共享锁

  • LOCK_IX: 意向排他锁

  • LOCK_S: 共享锁

  • LOCK_X: 排他锁

  • LOCK_AUTO_INC: 自增锁


在源码中有一个 lock_mode 的枚举类型,除了以上还有几个值:LOCK_NONE,用来表示一致性读,LOCK_NUM 用来表示 lock_mode 的数量,LOCK_NONE_UNSET 用来复位低 8 位  

lock_type:占用中间的 4 位,目前只用到了 5 位和 6 位,分别表示表锁(LOCK_TABLE)和 行锁(LOCK_REC)

record_lock_type:对于表锁类型来说都是空的,对于行锁目前值有:

  • LOCK_WAIT:表示正在等待锁

  • LOCK_ORDINARY:表示临键锁

  • LOCK_GAP:表示间隙锁

  • LOCK_REC_NOT_GAP:表示记录锁

  • LOCK_INSERT_INTENTION:表示插入意向锁

  • LOCK_CONV_BY_OTHER:表示锁是由其它事务创建的(比如隐式锁转换)

以上说的是锁的类型的表示,行锁、表锁类型相关信息都统一到一个字段了。同类型字段一样,行锁、表锁本身在innoDb中也统一用一个结构体来表示lock_t,大体如下:


struct lock_t {  trx_t* trx; // 锁所属的事务  UT_LIST_NODE_T(lock_t) trx_locks; // 事务所持锁的列表  ulint type_mode; // 锁类型  hash_node_t hash; // 全局锁哈希表对应的节点  dict_index_t* index; // 行锁的行记录索引  union {      lock_table_t; // 表锁       lock_rec_t rec_lock; // 行锁  } un_member; // 锁详情};
复制代码


行锁和表锁都用一个lock_t结构来表示,差异部分在一个 union 结构中表示,里面的 type_mode 即是上面介绍的锁类型,行锁的结构如下:


struct lock_rec_t {  ulint space; // 锁的space id  ulint page_no; // 锁的page number  ulint n_bits; // 锁住位置的bitmap};
复制代码


通过(space,page_no)可以确定锁所在的页,innoDb内部还会有个字段heap_no来表示记录在页上的偏移,也就是说三元组(space,page_no,heap_no)可以唯一的确定一行的位置。在分配lock_rec_t结构的时候,还会为其在最后分配一个大小为 n_bits 的 bitmap,而记录偏移的 bit 即为heap_no,用来快速判断这页哪些记录加了锁。


innoDb所有的行锁会插入到一个全局 hash 表(lock_sys->rec_hash)中,相同(space,page_no)也就是同一页的锁会被 Hash 到同一个 bucket 里,通过lock_t->hash串成链表。


总结一下,就是同一事务,同一类型的行锁在同一页上会复用同一个锁结构lock_t,用后面的 bitmap 来具体表示锁哪些行,大大节约了空间。同一页上不同的事物或类型的锁通过链表串起来放在rec_hash的同一个 bucket 里,利用 hash 的结构先定位到页,然后遍历同一页上不同的lock_t,就可以得到哪些事物的哪些锁锁住了哪些行,这种设计平衡了时间和空间的效率。

总结

innoDB 锁系统配合 MVCC 机制一起实现了事务的一致性隔离性,innoDB 中的锁总类繁多,并且和事务隔离级别关系密切,不同语句在不同隔离级别下的加锁情况大有不同,细节尤其多,而了解这些对排查死锁会有很大的帮助。行锁在 innoDB 中的实现也颇为巧妙,值得学习。

参考链接

  • https://schecterdamien.github.io/2021/03/04/mysql-lock/

  • https://dev.mysql.com/doc/refman/8.0/en/innodb-locking.html

  • http://mysql.taobao.org/monthly/2017/12/02/

  • http://mysql.taobao.org/monthly/2016/01/01/

  • http://mysql.taobao.org/monthly/2018/05/04/

  • https://www.aneasystone.com/archives/2017/12/solving-dead-locks-three.html

  • https://www.cnblogs.com/jojop/p/13982679.html


本文转载自:360 技术(ID:qihoo_tech)

原文链接:MySQL锁系统总结

2021-03-26 07:008010

评论

发布
暂无评论
发现更多内容

MAUI + Masa Blazor 开发界面跟随系统主题切换的App

MASA技术团队

.net blazor MASA MAUI Xamarin

如何有效改进回顾会议(下)?

敏捷开发

Scrum 回顾会 Scrum团队

ClickHouse与Elasticsearch压测实践

京东科技开发者

elasticsearch 分布式 数据分析 Clickhouse 数据库·

研发管理 DevOps 最佳实践之三问三答

极狐GitLab

DevOps gitlab CI/CD 代码规范 gitops

大厂裁员小厂跑路,是时候做这件事了,否则到时可别后悔!!!

CRMEB

Databend v0.8 新版本上线!

Databend

开源社区 云平台 大数据 开源 databend

另眼旁观 Linkerd 2.12 的发布:服务网格标准的曙光?

张晓辉

云原生 kuberne Linkerd 服务网格

携手HMS Core统一扫码服务, 兴业证券优理宝App提升用户扫码体验

HarmonyOS SDK

扫码

SpringCloud Eureka参数配置项详解

echoes

深圳选择java培训机构哪家靠谱?

小谷哥

web前端培训学习应该注意什么

小谷哥

ClickHouse 挺快,esProc SPL 更快

dvlinker

数据库 oracle sql Clickhouse SPL

阿里云首期云原生加速器第二次集结活动成功举办,秒云获阿里云加速器荣誉伙伴认证

MIAOYUN

阿里云产品集成认证 阿里云产品生态集成认证 阿里云云原生加速器 阿里云首期云原生加速器 阿里云加速器荣誉伙伴

详解 Sqllogictest

Databend

大数据 databend Sqllogictest

设计模式的艺术 第十章桥接设计模式练习(设计一个数据转换工具,可以将数据库中的数据转换成多种文件格式,例如txt、xml、pdf等格式,同时该工具需要支持多种不同的数据库)

代廉洁

设计模式的艺术

选择web前端培训机构需要注意什么?

小谷哥

数字藏品app:如何开发?

开源直播系统源码

数字藏品 数字藏品软件开发 数字藏品开发 数字藏品系统

10大常用的排序算法(算法分析+动图演示)

Five

算法 排序算法 8月月更

建成 5000 多间「梦想中心」后,他们决定将技术开源

腾源会

开源 公益 腾源会

Databend 源码阅读系列(一): 开篇

Databend

源码阅读 源码剖析 云平台 大数据 开源 databend

参加大数据培训机构学习前景怎么样

小谷哥

一文读懂数据科学Notebook

Baihai IDP

人工智能 ide AI notebook 数据科学

Tapdata 获得阿里云首批产品生态集成认证,携手阿里云共建新合作

阿里巴巴云原生

阿里云 Serverless 云原生 SAE 合作

vivo 基于 JaCoCo 的测试覆盖率设计与实践

vivo互联网技术

DevOps JACOCO

Java反射是什么

TimeFriends

8月月更

开源 DevOps 工具,你值得拥有!

SoFlu软件机器人

如何快速地学习东西(下篇)

宇宙之一粟

学习方法 8月月更

SpringCloud 注册中心 (Eureka) 快速入门

微服务 Eureka SpringCould 8月月更

java程序员培训学习需要多长时间?

小谷哥

分分钟带你了解 ES2022 最重要的 4 个特性!

掘金安东尼

前端 8月月更 ES2022

无需编写一行代码,实现任何方法的流量防护能力

阿里巴巴云原生

阿里云 微服务 云原生 流量

MySQL锁系统总结_架构_360技术_InfoQ精选文章