MySQL客户端与服务端通信机制解析

发表时间: 2022-07-13 23:20

Mysql客户端和服务端如何通信

客户端和服务端连接方式

运行的Mysql客户端程序以及服务端程序其实都是操作系统上的一个进程,客户端和服务端的通信其实就是两个进程间的通信,Mysql支持如下三种通信方式。

TCP/IP

在日常程序开发中服务端和客户端大概率不会运行在同一台主机上,那么服务端和客户端之间的通信需要依赖网络传输,Mysql采用最多的就是TCP/IP形式,服务端默认监听3306端口,当然我们可以修改my.cnf文件让服务端监听其它端口,那么启动客户端程序可以采用mysql -h{服务端IP} -uroot -P3307 -p命令其中

-h{服务端IP}表示指定Mysql服务端IP。

-P3307表示指定服务端监听的端口号,默认3306如果服务端修改了默认监听端口号,客户端可以采用-P指定。

命名管道和共享内存

使用这两种通信方式的前提有两个

  • 需要是一个Windows环境。
  • 客户端和服务端需要在同一台机器上。

其实基于这两点注定了这两种通信方式不会被应用到生产中,原因是生产环境的服务器大多以Linux服务器为主而且生产客户端和服务端也不太可能在同一台服务器上,所以这种方式了解即可。

Unix域套接字文件

使用这种通信方式同样有两个条件

  • 需要是一个类Unix环境。
  • 客户端和服务端在同一台机器上,也就是同一台机器的不同进程通信。

当我们的客户端启动时-h指定的是localhost,如mysql -hlocalhost -uroot -P3306 -p或者客户端程序启动未指定服务端IP(也就是没有-h参数),又或者指定了--protocol=socket的启动参数,那么就是使用了Unix域套接字文件通信。

Mysql服务端默认监听服务器下/tmp/mysql.sock文件,客户端也会默认连接到这个Unix域套接字文件,如下所示(文件类型为s,代表套接字文件)。

当然这个文件用户可以重新指定

服务端:mysqld --socket=/tmp/a.txt

客户端:mysql -hlocalhost -uroot --socket=/tmp/a.txt -p

Unix域套接字文件通信的好处就是减少了网络通信带来的资源消耗,客户端和服务端在同一个服务器下就可以采用此方案。

服务端处理过程

其实不论客户端和服务端如何通信,其实最终的效果就是客户端向服务端发送一段文本(SQL语句),服务端向客户端返回一段文本(处理结果),那么服务端具体如何操作呢?大致过程如下图所示。

连接器

客户端和服务端采用TCP/IP、命名管道和共享内存、Unix域套接字文件多种连接方式建立连接后,服务端会创建一个线程用来专门和这个客户端进行交互,当客户端断开后,服务端并不是立马将这个线程销毁,而是缓存起来等与其它客户端建立连接时使用,在客户端和服务端建立连接后服务端程序会对客户端程序提供的身份信息进行认证,认证失败服务端程序将拒绝连接。

查询缓存

当客户端A查询完一个语句,Mysql会将查询语句和结果放入缓存中,当客户端B采用完全相同的查询语句去查询时就会命中缓存,但是需要注意Mysql服务器并没有人聪明,如果两个查询语句在任何字符上有不同如空格、注释、大小写等,都会导致缓存无法命中,如下SQL,最终执行结果一致但不会命中同一个缓存。

select * FROM student where sname='张三'select * FROM student where /*test~*/ sname='张三'SELECT * FROM student where sname='张三';

除了上述情况外,还需要注意一些不被缓存的场景

  • 查询SQL中包含一些系统函数如NOW每次调用都会产生新的结果,不可能被缓存。
  • 查询SQL中包含一些系统表如mysql,information_schema,performance_schema数据库中的表,不会被缓存,因为系统表需要获取最新结果。
  • 用户自定义变量和函数。### 设置自定义变量
    SET @test = 8;
    ### 查询自定义变量
    select @test;

而且缓存还存在一些失效情况

Mysql的缓存系统会监控涉及到的每一张表,如果对缓存中的表使用了INSERT、UPDATE、DELETE、TRUNCATE TABLE、ALTER TABLE、DROP TABLE或 DROP DATABASE语句,那么这些表对应的缓存将失效。

缓存适当的使用确实能提升系统的查询性能,但对于Mysql来讲维护成本太高,所以在5.7.20就默认关闭了缓存不推荐使用,在Mysql8.0彻底移除了缓存功能。

分析器

走到这个阶段说明缓存没有命中,这时进入正式的查询阶段,对客户端发送过来的文本内容进行分析,判断语法是否正确,然后提取需要查询的表,需要查询的列,查询条件等信息加载到Mysql中。

这个阶段本质来讲就是编译,对文本进行语法分析,词法解析,语义分析。

优化器

经过分析器分析,我们可以得到要查询的表,查询的列,过滤条件但是这些还不够,我们需要优化器在表里面存在多个索引时决定使用哪个索引,或者一个语句有多表关联时,决定各个表的连接顺序,如下。

### s表和g表关联查询,两个表都有sno字段,using通过sno字段关联两个表select * from student s join grade g using(snowhere s.id = 1111 and g.id = 111

这条SQL即可先从表s中取出id=1111记录的sno值,再根据sno值关联到表g中,再判断g表中id值是否等于111。

也可以先从表g中取出id=111记录的sno值,再根据sno值关联到表s中,再判断s表中id值是否等于1111。

这两种方案执行的结果一致,但是执行的效率可能有所不同,所以优化器就来决定用哪一个方案。

优化的结果就是生成了执行计划

执行器

Mysql通过分析器知道了需要做什么,通过优化器知道了该如何做,于是就进入了执行器,开始执行SQL语句。

假设存在如下SQL需要执行

select * from student s where id1111

执行器的步骤大概如下

  • 执行器调用执行引擎提供的接口取这个表的第一行,判断ID值是否为1111,如果不是则跳过,如果是则将这条记录存到结果集中。
  • 调用引擎接口取下一行,重复相同的判断逻辑,直到取到这个表的最后一行记录。
  • 执行器将上述遍历过程中所有满足条件的行组成记录集作为结果集返回给客户端。