MySQL面试题-重难点

07-17 1093阅读

mysql中有哪些锁?举出所有例子,各个锁的作用是什么?区别是什么?

共享锁:也叫读锁,简称S锁,在事务要读取一条记录时,先获取该记录的S锁,别的事务也可以继续获取该记录的S锁,但不能获取X锁,会阻塞。事务提交后锁会释放。(S S 兼容;S X不兼容;X X不兼容)

MySQL面试题-重难点
(图片来源网络,侵删)

独占锁:也叫写锁,简称X锁,在事务要改动一条记录时,先获取该记录的X锁,别的事务不能再获取该记录的S锁和X锁,会阻塞,事务提交后锁释放。

全局锁:加了全局锁后整个数据库都处于只读的状态,进行增删改操作及表结构变更操作都会被阻塞,当会话断开后全局锁自动释放。主要用于全库逻辑备份。

表级锁:分为共享表锁和独占表锁。

本线程对一个表格加了共享表锁,允许多个事务并发的读取表,但会阻塞任何写操作包括本线程,直到事务结束后释放锁。

本线程对一个表加了独占表锁,当前事务能对表进行读写操作,其他事务不能对该表进行任何操作,保证当前事务对该表的独占访问权限,事务结束后释放。

行级锁:对表中的一行或多行记录进行加锁控制。InnoDB 支持行级锁,而 MyISAM不支持行级锁。分为三类,记录锁、间隙锁和临键锁。

    • Record Lock:记录锁,锁住一条记录。一个事务对一条记录加S锁后,其他事务可以继续加S锁,但不能加X锁。一个事务对一条记录加X锁后,其他事务不能再对记录加S锁和X锁。
    • Gap Lock:间隙锁,只存在RR隔离级别下,为了解决幻读问题。间隙锁之间是兼容的,两个事务可以同时持有包含共同间隙范围的间隙锁,并不存在互斥关系。
    • Next-Key Lock:临键锁,Record Lock + Gap Lock 的组合,锁定数据本身,并锁住数据前面的间隙。因为包含记录锁,需要考虑S锁和X锁之间的冲突关系。

    意向锁:分为意向共享锁(IS)和意向独占锁(IX),表示事务想要在行上设置共享锁或独占锁。是一种表锁,InnoDB自动加的,不需要用户干预。

    乐观锁:假设并发操作时不会发生冲突,只在提交事务时检查数据是否被其他事务修改过,不会产生任何锁和死锁。适合多读少写的场景

    悲观锁:假设数据在并发操作时总是会被其他事务修改,会对数据立即加锁。行锁、表锁、读写锁、序列化实现的锁都是悲观锁。

    什么是排他锁、共享锁、意向锁?解析一下概念和使用场景?

    排他锁:适用于写操作或更新操作,确保事务修改的时候其他事务不能同时修改相同数据,防止出现数据不一致或者丢失更新的问题。

    共享锁:适用于读操作,允许多个事务并发读取数据,提高系统读取性能。

    意向锁:尝试在具体行加锁之前,事务先需要在表级别获取意向锁,获取到意向锁后事务可以对表中具体行加锁。 使得数据库能够清楚地了解一个事务希望对表中哪些行加锁

    mysql中行锁是如何实现的?行锁锁的东西是什么?索引还是具体数据?

    行锁是通过索引来锁定行,InnoDB执行一条需要加行锁的SQL语句时,先找到对应的索引,然后对该索引加锁,因为索引指向的是实际的数据,所以对应的数据也被锁定。如果该表没有索引或者查询时没使用索引,行锁会退化成表锁。

    mysql一条语句是如何加锁的? 如何判断加的是行锁还是表锁?

    首先对SQL语句进行解析生成执行计划。根据语句的类型及具体的操作确定需要加锁的类型(读/写)。根据涉及到的索引来确定需要加锁的行,如果没有使用索引就退化成表锁。语句执行过程中,根据锁的类型和范围对相应的索引加锁。

    可以通过Explain查看执行计划,使用了索引通常使用的就是行锁,没有使用索引就可能会退化成表锁。

    update没加索引会锁全表吗?

    当执行 UPDATE 操作时,InnoDB需要锁定所有被更新的行,确保数据的一致性和事务的隔离性。如果没有使用索引限制要更新的行,InnoDB可能会执行全表扫描,从而锁定整个表中的所有行。

    如何判断sql加的是行锁还是间隙锁还是临键锁?

    通过 SHOW ENGINE INNODB STATUS 命令查看当前详细状态信息,在输出结果中查找 TRANSACTIONS部分,能够看到当前事务的锁信息。

    • lock_mode X locks rec but not gap:表示行锁(Record Lock)。
    • lock_mode X locks gap before rec:表示间隙锁(Gap Lock)。
    • lock_mode X locks rec:表示临键锁(Next-Key Lock)。

      还可以通过结合隔离级别和查询模式来分析当前的锁状态,RC级别下只有行锁,RR级别下能够使用行锁、间隙锁和临键锁。

      当查询条件使用的是主键索引,并做了等值查询加的就是行锁。

      当查询条件使用的是普通索引,并做了范围查询,一般使用的是间隙锁。

      当查询条件使用的是普通索引,做了精准查询,一般加的就是临键锁。

      -- id字段是主键
      SELECT * FROM employees WHERE id = 1 FOR UPDATE;
      -- age字段是普通索引
      SELECT * FROM employees WHERE age > 30 FOR UPDATE;
      -- age字段是普通索引
      SELECT * FROM employees WHERE age = 30 FOR UPDATE;

      都有哪些日志,分别有什么作用?

      Undo Log:回滚日志,当执行一条写入型SQL时都会记录在Undo Log中,在内部会形成一个单向链表,称为Undo版本链。有一个隐藏字段roll_ptr回滚指针,日志中记录的旧数据不止一条,需要回滚时,回滚指针指向对应的记录版本,然后覆盖掉改动过的数据。

      Redo Log:重做日志,当数据库发生宕机后通过Redo Log来恢复数据。MySQL在运行过程中大量操作都在内存中进行,然后由后台线程刷写到磁盘中,因为是基于内存一旦发生宕机、重启内存中的数据就会消失,Redo Log就是为了解决这个问题。在向内存写数据时,会先写到日志,后续数据没有写到磁盘中,或者发生宕机,就能通过Redo Log来恢复数据。

      Bin Log:变更日志,记录所有对数据库表结构变更和表数据修改的操作(增删改),Bin Log的本地日志文件采用追加写的模式,一个文件写满就创建新的文件,Bin Log会记录SQL的语句。常用于数据灾备,误删了数据库可以直接去本地找Bin Log文件,将删库的记录移除后,利用MySQLBinLog工具导出SQL文件,然后执行该文件来恢复删除前的数据。

      Erro Log:线上MySQL由于内在因素(断电、硬件损坏...)导致崩溃时,辅助线上排错的日志。记录报错信息,包括启停时间、报错的诊断信息也包括错误、警告、提示等多个级别的日志详情。

      Slow Log:当一条SQL执行的时间超过规定阈值后就会被记录在慢查询日志中,线上出现相应缓慢的问题时可以通过查看慢日志来定位问题,然后进行优化。

      binlog和redolog的区别?

      • ①Redo-log是InnoDB专享的,Bin-log是所有引擎通用的。
      • ②Redo-log是用两个文件(写到了哪,哪些已经写完了)循环写,写满之后从头开始覆盖,而Bin-log是不断创建新文件追加写,一个文件写满了就创建新文件写。
      • ③Redo-log中记录的都是变更后的数据,而Bin-log会记录变更SQL语句。
      • ④Redo-log主要实现故障情况下的数据恢复, Binlog 记录所有更改数据的操作,可以用于将数据库恢复到某个特定的时间点。
      • ⑤ Redo Log 在事务提交前需要写入到磁盘(写到日志文件中,但此时只是预提交状态)。事务在提交前所有的操作都会记录在 Binlog 中,一旦事务提交,Binlog 会将记录持久化到磁盘。

        为什么mysql数据存储在磁盘,还需要用日志多写一份数据?意义在哪里?

        为了保证数据库的持久性和一致性,并且当系统发生故障时可以通过日志进行数据恢复。

        持久性:事务一旦提交就要永久保存在系统中,即使系统发生崩溃。通过Redo Log能恢复已提交的事务,保证数据的持久性。

        一致性:所有的修改操作先记录到日志中,日志写入成功后事务才提交,即使系统崩溃也能通过日志恢复事务,确保数据库的一致性。

        系统崩溃数据恢复:通过Redo Log能够重做所有已提交的事务,让数据库恢复到最新的状态。Undo Log用于事务回滚和MVCC,事务执行过程中的所有更新会首先记录在Undo Log中。

        Bin Log:记录所有对数据库的修改操作,用于数据恢复和主从复制。

        mysql底层分别是怎么实现ACID的?(结合日志体系+sql执行流程去说)

        原子性:事务中的操作要么全都完成,要么全都不完成。事务中的写入型语句都会记录在Undo Log中,内部形成一个链表,事务需要回滚时,回滚指针指向对应的记录版本,然后覆盖掉改动过的数据,从而保证原子性。

        一致性:通过原子性+持久性+隔离性来实现

        隔离性:一个事务的操作在提交之前对其他事务是不可见的,通过锁机制和MVCC机制来实现。

        持久性:事务提交后数据就永久保存在系统中,系统崩溃数据也不丢失。主要通过Redo Log和Bin Log实现, 事务提交时,MySQL 会将更改记录到 Redo Log 并立即刷写到磁盘。Bin Log记录所有对数据库的修改操作,确保在崩溃恢复后可以恢复这些操作。

        一条查询SQL的执行流程?

        1. 客户端通过MySQL连接器将查询语句发送到MySQL服务器。
        2. MySQL服务器的连接管理器接收客户端的查询,为客户端连接分配线程来处理查询。
        3. 进行词法和语法分析,词法分析识别出关键字。语法分析判断语法是否正确,然后构建出语法树。
        4. 在预处理器中检查语句中的表或字段是否存在。
        5. 查询优化器接收预处理后的查询并生成执行计划,找到最优的执行方案。
        6. 执行计划生成,包括使用那个索引,表的连接顺序、排序.....
        7. 执行查询,执行引擎根据执行计划进行实际查询操作。
        8. 执行引擎将查询结果返回给客户端,通过连接器传递结果。

        一条更新sql的执行流程?

        1. 客户端发送更新查询到MySQL服务器。
        2. 连接管理器接收查询并分配线程处理。
        3. 解析器将SQL语句解析成内部数据,进行语法分析和词法分析。
        4. 在预处理器中检查语句中的表或字段是否存在。
        5. 选择最优的执行路径,生成执行计划,选择合适的索引
        6. 执行更新操作,生成Undo Log,记录更新前的数据,以便需要回滚,生成Redo Log记录更新后的数据。
        7. 提交事务,将Redo Log刷新到磁盘,更新后的数据写进内存缓冲池,提交后写进磁盘。
        8. 将结果返回给客户端。

        mysql的 server层和引擎层有什么区别? 为什么要分这两层?

        server层用来对 sql语句进行语法分析,优化选择器选择执行计划。引擎层负责真正的执行 sql语句的操作。分层目的就是为了解耦,方便扩展,像引擎层就有innodb引擎,myisam等引擎,后续要添加其他引擎时方便扩展。并且各种引擎都共用 server 层的语法分析器,优化选择器等,减少代码冗余。

        死锁问题 行锁的理解?

        死锁就是两个或多个线程并发访问数据库,造成两个或多个线程相互等待对方的资源,而造成的相互等待问题。innodb 存储引擎支持行锁,是一种粒度比较小的锁。有行排他锁,和行共亨锁。因为粒度比较小,所以死锁的概率也是比较大。此外行锁也会额外的占用系统资源。

        事务两阶段提交的概念能理解吗?

        第一阶段,先写Redo Log标记为准备提交状态,表示Bin Log还没落盘,然后写Bin Log。

        第二阶段,再写Redo Log标记为提交状态,此时Bin Log已经落盘。

        为什么需要两阶段提交

        确保Redo Log和Bin Log中数据都是一致的。系统宕机后恢复数据时,Redo Log中的事务是提交状态表示Bin Log一定落盘了能直接恢复,如果Redo Log中事务状态是准备状态,就要判断Bin Log中是否存在这个事务,存在就恢复,不存在就回滚来保证数据一致性。

        mysql会有缓存机制吗 buffer pool和change buffer作用是什么?

        MySQL由多种缓存机制,包括 Buffer Pool 和 Change Buffer。

        Buffer Pool:MySQL中的内存缓存之一,用于存储数据页。作用包括,将热点数据存储在内存中来减少磁盘IO,缓存数据页和索引,来提高查询速度。

        Change Buffer:MySQL中的一个附加缓存,用作优化写操作。作用包括,在执行写入类型操作时,InnoDB不会立即将数据写入数据页,先将变更记录在Change Buffer中,通过延迟数据页更新将多个变更操作合并成更少的磁盘写入操作,来降低IO操作,然后在后台线程异步刷新到对应的数据页。

        为什么要有buffer pool?如何管理buffer pool

        buffer pool是一块非常重要的内存区域,用来缓存数据库表和索引的磁盘数据页。读数据时先从缓冲池查,存在就直接返回,写数据先写缓冲池的数据页,然后后台异步写入磁盘,能够减少磁盘IO。内存访问速度比磁盘快能提升读写性能。

        可以设置缓冲池大小一般是物理内存的70%~80%,根据硬件来设置每秒可以处理的IO操作数,可先通过性能测试工具进行负载测试。

        从数据页的角度看B+树

        B+树的每个节点都会尽可能填满一个数据页,能减少每次磁盘IO操作时需要读取的数据页,一个节点超过数据页的容量会分裂,因删除操作造成空间节点过大时,会触发合并操作。

        count(*)和count(1)有何区别?那个性能更高?

        count(*)和count(1):都是统计结果集中的行数。

        性能:count(1)会快一点,因为不需要解析或者检查具体的列值,只需要计算每一行的计数,但几乎没有什么差异, 建议使用 COUNT(*),更加清晰和通用。

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]