MYSQL系列

mysql查询成本比较

2022-04-11  本文已影响0人  CXY_XZL

1.工具

1.mysql8.0.25
2.msyqlworkbench


2.成本定义

执行sql查询所需要花费的代价


3.查看成本的方式

执行一条示例语句,如下:

select sql_no_cache suser.id,suser.name ,srole.name from sys_user suser
 inner join sys_user_role surole on suser.id=surole.user_id
 inner join sys_role srole on surole.role_id=srole.id;

sql_no_cache:告诉mysql服务器不缓存这条语句的执行结果

执行完上面的sql语句后,再执行以下语句查看查询成本:

show status like 'last_query_cost';

执行结果截图如下:


查询成本.png

不过,workbench可以直接在执行计划中展示查询成本,截图如下:

workbench查看查询成本和执行计划.png

从执行计划中可以看到:
1.执行计划的第一步是查询stole表,而且是全表查询;
2.执行计划的第二部是查询surole表,也是全表查询;
3.执行计划的第三部是查询suser表,通过聚集索引查询,所以精确查找出一条匹配的数据;
4.srole表和surole表通过hash join关联查询数据,最终查出12条匹配的数据,然后和suer表的查询结果进行嵌套循环查询,前台循环查询的成本计算公式很简单,就是将潜逃的字查询的查询成本进行累加求和;
5.sql语句中,suser表是主表,然后依次关联surole表和srole表。但是,执行计划是先查询srole表,再查询surole表,最后查询suser表,两者顺序不同;
6.这是mysql优化器最终选择的它认为最优的执行计划;


4.sql的第二种写法

上面的sql可以用另一种写法,然后我们再看看新写法的查询成本
以下是新的写法:

select straight_join suser.id,suser.name ,srole.name from sys_user suser
 inner join sys_user_role surole on suser.id=surole.user_id
 inner join sys_role srole on surole.role_id=srole.id;

straight_join: 让mysql优化器按照sqljoin顺序来查询数据
现在我们再看一下查询成本及执行计划:

查询成本二.png
从上图可知:
1.现在的sql查询数据的顺序和执行计划是一致的;
2.最终查询成本是42.05,比优化器选择的执行计划的成本要高很多;

5.总结

1.从sql语句和执行计划可以看出,suser表全表只有12数据,srole表全表有4条数据,surole表全表有30条数据,如果suser表和srole表之间有关联字段的话,就能让这两张表做hash join关联查询,最后在与surole表做潜逃循环查询,这样的话,成本能比现在更低,但是,实际上,suser表和srole表之间并没有关联字段,所以这种假设不成立,感觉是在说废话...;
2.大多数情况下,优化器选择的执行计划都是查询成本最低的;


6.说明:

1.执行成本:执行成本为42.05的意思是,mysql认为大概需要做42个数据页的随机查找才能完成查询;
2.执行成本来源:执行成本是根据一系列的统计信息得来的,包括:每个表活着索引的页面个数、索引的基数(索引中不同值的数量)、索引和数据行的长度、索引分布情况;
3.优化器在评估成本的时候不会评估任何层面的缓存,包括mysql服务器内部的缓存,它假设读取任何数据都需要一次磁盘I/O;


7.mysql优化器在哪些情况戏会选择错误的(非最优的)执行计划

上一篇 下一篇

猜你喜欢

热点阅读