MySQLPHP经验分享MySQL

说一说MySQL的Join

2019-05-26  本文已影响2人  xcrossed

MySQL的join到底能不能用

经常听到2种观点

其实对于上面的观点一定程度上是正确的,但不是完全正确。但之所以流传这么广,主要还是没有搞清楚实际状态,而根据实际使用中总结出来的一些模糊规律。只有了解的MySQL的Join实际执行方式,就会知道上面2种观点是一种模糊的规律,这种规律并不能指导我们实际开发。下面就说说MySQL的实际join执行方式。

MySQL的join是如何执行的

join可以说一种集合的运算,比如left join,right join,inner join,full join,outer join,cross join等,这些集合间的计算关系对应在高中数学集合里面的交集,并集,补集,全集等。但在实际的代码中,join运算基本上是通过多层循环来实现的。

举一个例子,假设有t1,t2两张表,表结构分别如下,

create table t1 (
id int not null AUTO_INCREMENT,
username varchar(20) not null default '',
age int not null default 0,
PRIMARY key (`id`)
)ENGINE=INNODB DEFAULT CHARSET=UTF8MB4  ;

create table t2(
id int not null auto_increment,
username varchar(20) not null default '',
score int not null defalut 0,
primary key (`id`)
))ENGINE=INNODB DEFAULT CHARSET=UTF8MB4;

假设t1有100条数据,t2表有200条数据

查询sql为

select t1.*,t2.* from t1 left join t2 on(t1.username=t2.username)

那么这条SQL的执行步骤如下

基本上先遍历t,1,然后根据t1中的每行数据中的username,去表t2中查找满足条件的记录。基本就是2层循环。

如何优化join查询

从上面可以看出,join本质是循环,这里的开销如下

  1. 遍历t1数据,读取数据为t1表的行数,假设行数为n,则复杂度也为n
  2. 根据t1的匹配字段username去t2中一行一行的查询数据
    这个过程,因为MySQL的数据存储结构为二叉树,时间复杂度为log2(m) m为t2表的总行数
  3. 那么总复杂度近似为 n+n(2log2(m))

从上面的步骤可以看出,优化方向,

优化的基本方法

其实MySQL针对上面的优化方法有对应的算法,

到底要不用Join

从上面的分析我们可以看到,用Join还是可行的,只要性能可控且在接受范围内,还是能减少代码复杂度的。需要避免的是join的表没有索引,不然这样的SQL发线上是灾难性的。

总结

Join还是可以大胆的使用,只要把握好几个原则

上一篇 下一篇

猜你喜欢

热点阅读