运行的Mysql客户端程序以及服务端程序其实都是操作系统上的一个进程,客户端和服务端的通信其实就是两个进程间的通信,Mysql支持如下三种通信方式。
在日常程序开发中服务端和客户端大概率不会运行在同一台主机上,那么服务端和客户端之间的通信需要依赖网络传输,Mysql采用最多的就是TCP/IP形式,服务端默认监听3306端口,当然我们可以修改my.cnf文件让服务端监听其它端口,那么启动客户端程序可以采用mysql -h{服务端IP} -uroot -P3307 -p命令其中
-h{服务端IP}表示指定Mysql服务端IP。
-P3307表示指定服务端监听的端口号,默认3306如果服务端修改了默认监听端口号,客户端可以采用-P指定。
使用这两种通信方式的前提有两个
其实基于这两点注定了这两种通信方式不会被应用到生产中,原因是生产环境的服务器大多以Linux服务器为主而且生产客户端和服务端也不太可能在同一台服务器上,所以这种方式了解即可。
使用这种通信方式同样有两个条件
当我们的客户端启动时-h指定的是localhost,如mysql -hlocalhost -uroot -P3306 -p或者客户端程序启动未指定服务端IP(也就是没有-h参数),又或者指定了--protocol=socket的启动参数,那么就是使用了Unix域套接字文件通信。
Mysql服务端默认监听服务器下/tmp/mysql.sock文件,客户端也会默认连接到这个Unix域套接字文件,如下所示(文件类型为s,代表套接字文件)。
当然这个文件用户可以重新指定
服务端:mysqld --socket=/tmp/a.txt。
客户端:mysql -hlocalhost -uroot --socket=/tmp/a.txt -p。
Unix域套接字文件通信的好处就是减少了网络通信带来的资源消耗,客户端和服务端在同一个服务器下就可以采用此方案。
其实不论客户端和服务端如何通信,其实最终的效果就是客户端向服务端发送一段文本(SQL语句),服务端向客户端返回一段文本(处理结果),那么服务端具体如何操作呢?大致过程如下图所示。
客户端和服务端采用TCP/IP、命名管道和共享内存、Unix域套接字文件多种连接方式建立连接后,服务端会创建一个线程用来专门和这个客户端进行交互,当客户端断开后,服务端并不是立马将这个线程销毁,而是缓存起来等与其它客户端建立连接时使用,在客户端和服务端建立连接后服务端程序会对客户端程序提供的身份信息进行认证,认证失败服务端程序将拒绝连接。
当客户端A查询完一个语句,Mysql会将查询语句和结果放入缓存中,当客户端B采用完全相同的查询语句去查询时就会命中缓存,但是需要注意Mysql服务器并没有人聪明,如果两个查询语句在任何字符上有不同如空格、注释、大小写等,都会导致缓存无法命中,如下SQL,最终执行结果一致但不会命中同一个缓存。
select * FROM student where sname='张三'; select * FROM student where /*test~*/ sname='张三'; SELECT * FROM student where sname='张三';
除了上述情况外,还需要注意一些不被缓存的场景
而且缓存还存在一些失效情况
Mysql的缓存系统会监控涉及到的每一张表,如果对缓存中的表使用了INSERT、UPDATE、DELETE、TRUNCATE TABLE、ALTER TABLE、DROP TABLE或 DROP DATABASE语句,那么这些表对应的缓存将失效。
缓存适当的使用确实能提升系统的查询性能,但对于Mysql来讲维护成本太高,所以在5.7.20就默认关闭了缓存不推荐使用,在Mysql8.0彻底移除了缓存功能。
走到这个阶段说明缓存没有命中,这时进入正式的查询阶段,对客户端发送过来的文本内容进行分析,判断语法是否正确,然后提取需要查询的表,需要查询的列,查询条件等信息加载到Mysql中。
这个阶段本质来讲就是编译,对文本进行语法分析,词法解析,语义分析。
经过分析器分析,我们可以得到要查询的表,查询的列,过滤条件但是这些还不够,我们需要优化器在表里面存在多个索引时决定使用哪个索引,或者一个语句有多表关联时,决定各个表的连接顺序,如下。
### s表和g表关联查询,两个表都有sno字段,using通过sno字段关联两个表select * from student s join grade g using(sno) where s.id = 1111 and g.id = 111
这条SQL即可先从表s中取出id=1111记录的sno值,再根据sno值关联到表g中,再判断g表中id值是否等于111。
也可以先从表g中取出id=111记录的sno值,再根据sno值关联到表s中,再判断s表中id值是否等于1111。
这两种方案执行的结果一致,但是执行的效率可能有所不同,所以优化器就来决定用哪一个方案。
优化的结果就是生成了执行计划
Mysql通过分析器知道了需要做什么,通过优化器知道了该如何做,于是就进入了执行器,开始执行SQL语句。
假设存在如下SQL需要执行
select * from student s where id= 1111
执行器的步骤大概如下