SQL 之 ON 和 WHERE执行顺序

2020-07-16  本文已影响0人  堂堂正正的大号

那么 WHERE 是不是一定是在 ON 之后生效了 ? 我们带着这个疑问往下看

ON 和 WHERE 的常规区别

on 针对的关联条件,是表与表之间通过哪些列、以什么条件进行关联,而 where 针对的是过滤条件;两者从概念上来讲是不同的

另外 on 一定是与 join 一并使用的,join 会添加外部行,并将外部行中被驱动表的字段填充 null ,而 where 进行过滤的时候,只有逻辑判断为 true 的记录才会保留,逻辑值为 false 和 unknown 的记录都会过滤掉;两者得到的结果会有所不同。

上面说的可能有些抽象,我们结合具体示例来看;MySQL 版本 5.7.21 ,准备表和初始数据

create table tbl_a (a int primary key, b int, c int, d int, e varchar(50));
insert into tbl_a values (4,3,1,1,'a');
insert into tbl_a values (1,1,1,2,'d');
insert into tbl_a values (8,8,7,8,'h');
insert into tbl_a values (2,2,1,2,'g');
insert into tbl_a values (5,2,2,5,'e');
insert into tbl_a values (3,3,2,1,'c');
insert into tbl_a values (7,4,0,5,'b');
insert into tbl_a values (6,5,2,4,'f');

create table tbl_b like tbl_a;
insert into tbl_b SELECT * from tbl_a;

insert into tbl_a values (9,9,9,9,'9');
insert into tbl_b values (10,10,10,10,'10');

我们先来看看 left join(right join类似)

SELECT * FROM tbl_a a LEFT JOIN tbl_b b ON a.a = b.a AND a.b = b.b; /*query_on*/
SELECT * FROM tbl_a a LEFT JOIN tbl_b b ON a.a = b.a WHERE a.b = b.b; /*query_where*/

我们可以看到:

我们再来看看 inner join

SELECT * FROM tbl_a a INNER JOIN tbl_b b ON a.a = b.a AND a.b = b.b; /*query_on*/
SELECT * FROM tbl_a a INNER JOIN tbl_b b ON a.a = b.a WHERE a.b = b.b; /*query_where*/

我们可以看到,执行结果是一样的,inner join 查询的就是驱动表与被驱动表同时存在的记录,所以过滤条件不管放在 ON 里,还是放在 WHERE 里,执行结果是一样的


ON 和 WHERE 的生效时机
ON 后的关联条件与 WHERE 后的过滤条件,这两者的执行顺序是否如 SQL 执行顺序图中说的那样,ON 一定先与 WHERE ?

问题先放着,我们以 left join 为例,来看看 4 个案例,也许从中能找到我们想要的答案


1、左表与右表都没二级索引
刚好上面的 tbl_a 和 tbl_b 满足条件,我们来看看 SQL 的执行计划

EXPLAIN SELECT * FROM tbl_a a 
LEFT JOIN tbl_b b 
ON a.b = b.b AND a.c = b.c
WHERE a.b >= 2 AND a.b < 10 AND a.c > 0 
AND a.d != 1 AND a.e != 'a'

驱动表是 tbl_a,这个相信大家没问题,我们重点看下 type 和 Extra

这条 SQL 的执行流程应该是这样的:


此时大家看出什么了没 ? ON 后的关联条件是在 WHERE 后的过滤条件之前生效的吗 ?

这个案例不太常见,因为表没有二级索引,我们接着往下看看有二级索引的情况


2、左表有二级索引,右表无二级索引
我们在 tbl_a 建一个组合索引 create index idx_bcd on tbl_a(b, c, d); ,然后往 tbl_a 和 tbl_b 中各插入 10W 条记录,我们再来看执行计划


那么此时 SQL 的执行流程应该是这样的:
就步骤 1 与 示例 1 中的步骤 1 不同,其余 2 步是一样的

此时 WHERE 后的过滤条件的生效时机也是早于 ON 后的关联条件的。


3、左表无二级索引,右表有二级索引
将 tbl_b 作为左表,tbl_a 作为右表,我们来看效果

此时 SQL 的执行流程应该是这样的: 此时 ON 后的关联条件的生效时机是早于 WHERE 后的过滤条件的

4、左表与右表都有二级索引
我们在 tbl_b 表上建一个组合索引 create index idx_bcd on tbl_b(b, c, d); 我们来看看 SQL 的执行计划

此时 SQL 的执行流程应该是这样的: 先是 WHERE 中的 Index Filter 条件生效,然后是 ON 后的关联条件生效,最后是 WHERE 中的 Table Filter 生效,关联条件的生效时间穿插在过滤条件的生效时间中

自此,关于 ON 和 WHERE 的生效时机,你清楚了吗 ?
他两的生效时机,需要结合表结构,以及具体的 SQL 来分析,而不是 ON 一定先于 WHERE

转载来源:神奇的 SQL 之 ON 和 WHERE → 扑朔迷离,好多细节!

上一篇下一篇

猜你喜欢

热点阅读