阿里二面:条件字段有索引,为什么查询也这么慢?
前言
最近公司在代码评审时,在使用DATE_FORMAT函数的问题上有了点不同的观点。具体DATE_FORMAT对索引会不会产生影响?哪种情况下会产生影响呢?周末无事,通过mysql的执行计划测试一波。
使用 explain 分析
执行计划就是展示Mysql如何执行一条Sql语句,使用 EXPLAIN 。输出包括Sql查询的顺序、是否使用索引、以及使用的索引信息等内容, 展示如图
id : 表示查询中select操作表的顺序,按顺序从大到依次执行
select_type :该表示选择的类型,可选值有: SIMPLE(简单的)
type :该属性表示访问类型,有很多种访问类型。最常见的其中包括以下几种: ALL(全表扫描), index(索引扫描),range(范围扫描),ref (非唯一索引扫描),eq_ref(唯一索引扫描,),(const)常数引用, 访问速度依次由慢到快。其中 : range(范围)常见与 between and …, 大于 and 小于这种情况。提示 : 慢SQL是否走索引,走了什么索引,也就可以通过该属性查看了。
table : 表示该语句查询的表
possible_keys : 顾名思义,该属性给出了,该查询语句,可能走的索引,(如某些字段上索引的名字)这里提供的只是参考,而不是实际走的索引,也就导致会有possible_Keys不为null,key为空的现象。
key :显示MySQL实际使用的索引,其中就包括主键索引(PRIMARY),或者自建索引的名字。
key_len : 表示索引所使用的字节数,
ref : 连接匹配条件,如果走主键索引的话,该值为: const, 全表扫描的话,为null值
rows : 扫描行数,也就是说,需要扫描多少行,才能获取目标行数,一般情况下会大于返回行数。通常情况下,rows越小,效率越高, 也就有大部分SQL优化,都是在减少这个值的大小。注意: 理想情况下扫描的行数与实际返回行数理论上是一致的,但这种情况及其少,如关联查询,扫描的行数就会比返回行数大大增加)
Extra :这个属性非常重要,该属性中包括执行SQL时的真实情况信息,如上面所属,使用到的是”using where”,表示使用where筛选得到的值,常用的有: “Using temporary”: 使用临时表 “using filesort”: 使用文件排序
表语句及数据插入sql如图:
如果有伙伴需要验证,也附上SQL,和上面图片内容一致:
-- ----------------------------
-- Table structure for user
-- ----------------------------
DROP TABLE IF EXISTS `user`;
CREATE TABLE `user` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
`age` int(11) NULL DEFAULT NULL,
`birth_date` date NULL DEFAULT NULL,
`is_delete` tinyint(1) NULL DEFAULT NULL,
PRIMARY KEY (`id`) USING BTREE,
INDEX `name`(`name`) USING BTREE,
INDEX `age`(`age`) USING BTREE,
INDEX `birth_date`(`birth_date`) USING BTREE
) ENGINE = InnoDB AUTO_INCREMENT = 22 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;
-- ----------------------------
-- Records of user
-- ----------------------------
INSERT INTO `user` VALUES (1, '小明1', 1, '2000-01-01', 0);
INSERT INTO `user` VALUES (2, '小明2', 2, '2001-01-02', 0);
INSERT INTO `user` VALUES (3, '小明3', 3, '2002-01-03', 0);
INSERT INTO `user` VALUES (4, '小明4', 4, '2003-01-04', 0);
INSERT INTO `user` VALUES (5, '小明5', 5, '2004-01-05', 0);
INSERT INTO `user` VALUES (6, '小明6', 6, '2005-01-06', 0);
INSERT INTO `user` VALUES (7, '小明7', 7, '2006-01-07', 0);
INSERT INTO `user` VALUES (8, '小明8', 8, '2007-01-08', 0);
INSERT INTO `user` VALUES (9, '小明9', 9, '2008-01-09', 0);
INSERT INTO `user` VALUES (10, '小明1', 10, '2009-01-10', 0);
INSERT INTO `user` VALUES (11, '小明11', 11, '2010-01-11', 0);
INSERT INTO `user` VALUES (12, '小明12', 12, '2011-01-12', 0);
INSERT INTO `user` VALUES (13, '小明13', 13, '2012-01-13', 0);
INSERT INTO `user` VALUES (14, '小明14', 14, '2013-01-14', 0);
INSERT INTO `user` VALUES (15, '小明15', 15, '2014-01-15', 0);
INSERT INTO `user` VALUES (16, '小明16', 16, '2015-01-16', 0);
INSERT INTO `user` VALUES (17, '小明17', 17, '2016-01-17', 0);
INSERT INTO `user` VALUES (18, '小明18', 18, '2017-01-18', 0);
INSERT INTO `user` VALUES (19, '小明19', 19, '2018-01-19', 0);
INSERT INTO `user` VALUES (20, '小明20', 20, '2019-01-20', 0);
INSERT INTO `user` VALUES (21, '小明21', 21, '2020-01-21', 0);
验证过程
注意:本文中采用的数据库为mysql:5.7.24。
1、不用DATE_FORMAT函数
第一种方式:
explain select * from user where birth_date <= '2009-10-10';
如上图所示可能用到 key: birth_date 。
第二种方式:
EXPLAIN SELECT * FROM USER WHERE birth_date <= '2009-10-10' and birth_date >= '2009-10-10';
如上图所示用到 key: birth_date 。
2、使用DATE_FORMAT函数
第一种方式:
EXPLAIN
SELECT
*
FROM
USER
WHERE
birth_date >= DATE_FORMAT('2019-10-10', '%Y-%m-%d');
EXPLAIN
SELECT
*
FROM
USER
WHERE
birth_date >= DATE_FORMAT('2019-10-10', '%Y-%m-%d')
AND birth_date <= DATE_FORMAT('2020-12-10', '%Y-%m-%d');
第二种方式:
EXPLAIN
SELECT
*
FROM
USER
WHERE
DATE_FORMAT(birth_date, '%Y-%m-%d') >= '2019-10-10';
EXPLAIN
SELECT
*
FROM
USER
WHERE
DATE_FORMAT(birth_date, '%Y-%m-%d') >= '2019-10-10'
AND DATE_FORMAT(birth_date, '%Y-%m-%d') <= '2020-12-10';
以上两组SQL分别在字段和参数上加了DATE_FORMAT进行测试,结果如图,birth_date的索引均未生效, 主要看 字段 key。
所以,在开发过程中,应避免使用该类函数,否则可能会导致索引失效,全表扫描。
总结
根据实际情况进行选择:
①使用 DATE_FORMAT 中的第一种方式,在查询参数使用DATE_FORMAT,而不是查询字段使用。
EXPLAIN
SELECT
*
FROM
USER
WHERE
birth_date >= DATE_FORMAT('2019-10-10', '%Y-%m-%d')
AND birth_date <= DATE_FORMAT('2020-12-10', '%Y-%m-%d');
②不用DATE_FORMAT中的第二种方式,按照范围进行查询,如查询一
-- 举例:
EXPLAIN SELECT
*
FROM
USER
WHERE
create_time >= '2026-10-24 00:00:00'
AND create_time <= '2026-10-24 23:59:59';
写在最后
欢迎大家关注我的公众号【风平浪静如码】,海量Java相关文章,学习资料都会在里面更新,整理的资料也会放在里面。
觉得写的还不错的就点个赞,加个关注呗!点关注,不迷路,持续更新!!!