MYSQL-查询优化

2019-04-25 本文已影响0人 AGEGG

请简述项目中优化MySQL语句执行效率的方法，从哪些方面入手，SQL语句性能如何分析？

1.分析查询速度

记录慢查询日志
分析查询日志，使用pt-query-digest工具进行分析
使用show profile
set peofiling=1; 开启，服务器上执行的所有语句会检测消耗的时间、存到临时表中
show profiles 所有的SQL语句执行记录
show profile for query 临时表ID 查执行ID的SQL语句

mysql> set profiling=1;
Query OK, 0 rows affected

mysql> select * from user;
+----+------+-----+
| id | name | age |
+----+------+-----+
|  1 | Jack |  23 |
+----+------+-----+
1 row in set

mysql> show profiles;
+----------+------------+---------------------------------+
| Query_ID | Duration   | Query         |
+----------+------------+----------------------------------+  
|       1 |   8.675E-5 | set profiling=1         |
|       2|   0.000197 | select * from user          |
+----------+------------+---------------------+
10 rows in set

mysql> show profile for query 2;
+----------------------+----------+
| Status               | Duration |
+----------------------+----------+
| starting             | 4.3E-5   |
| checking permissions | 7E-6     |
| Opening tables       | 1.8E-5   |
| System lock          | 1E-5     |
| init                 | 1.4E-5   |
| optimizing           | 4E-6     |
| statistics           | 3.1E-5   |
| preparing            | 1E-5     |
| executing            | 2E-6     |
| Sending data         | 1E-5     |
| end                  | 3E-6     |
| query end            | 2E-6     |
| closing tables       | 5E-6     |
| freeing items        | 3.5E-5   |
| logging slow query   | 3E-6     |
| cleaning up          | 2E-6     |
+----------------------+----------+
16 rows in set

show status
show status会返回一些计数器，show global status查看服务器级别的所有计数。
show processlist
观察是否有大量的线程处于不正常的状态或特征。
explain
分析单条的SQL语句
mysql> explain select * from user;

+----+-------------+-------+--------+---------------+------+---------+------+------+-------+
| id | select_type | table | type   | possible_keys | key  | key_len | ref  | rows | Extra |
+----+-------------+-------+--------+---------------+------+---------+------+------+-------+
|  1 | SIMPLE      | user  | system | NULL          | NULL | NULL    | NULL |    1 |       |
+----+-------------+-------+--------+---------------+------+---------+------+------+-------+
1 row in set

explain它有一个别名desc，所以使用explain select * from user;查询到的结果与上面的一样。

2.优化查询过程中的数据访问

数据太多会导致查询性能下降。
确定应用程序是否在检索大量超过需要的数据，可能太多行或列。
确认MySQL服务器是否在分析大量不必要的数据行

避免使用以下SQL语句

查询不需要的记录，使用limit解决
多表管理返回全部列，需要制定列，如A.id、B.name等
总是取出全部列，select *会让优化器无法完成索引覆盖扫描优化
重复查询相同的数据，可以使用缓存，下次直接读取缓存

是否在扫描额外的记录

使用explain来进行分析，如果发现查询需要扫描大量的数据但是只返回少数的行，可以通过如下技巧去优化：
使用索引覆盖扫描，把所有的列都放在索引中。
改变数据库和表的结构，修改数据表范式
重写SQL语句，让优化器可以以最优的方式执行查询

3.优化长难的查询语句

MYSQL内部每秒能扫描内存中上百万行数据，相比之下，响应数据给客户端就要慢得多
使用尽可能小的查询是好的，但有时将一个大的查询分解成多个小的查询是很有必要的。

切分查询

将一个大的查询分为多个小的相同的查询
一次性删除1000万的数据比一次删除1万，暂停一会儿在执行删除1万条数据要较少更多的服务器开销。

分解关联查询

可以将一条关联语句分解成多个SQL语句执行
让缓存的效率更高
执行单个查询可以减少锁的竞争
在应用层做关联可以更容易对数据库进行拆分

4.优化特定类型的查询语句

优化count()查询

count()占用的会忽略所有的列，直接统计所有的列数，因此不要使用count(列名)
MyISAM中没有任何where条件的count(* )查询速度非常快
有where条件时，MyISAM的count统计不一定比其他表引擎快

优化：

可以使用explain查询近似值，用近似值代替count(*)
增加汇总表
使用缓存

优化关联查询

确定on或者using子句的列上有索引；
确保group by和order by中只有一个表中的列，这样MySQL才有可能使用索引；

优化子查询

尽量使用关联查询替代

优化group by和distinct

使用索引来优化
关联查询中，使用标识列（主键列）进行分组的效率会更高
如果不需要order by，进行group by时使用order by NULL，MySQL不会进行文件排序

with rollup超级聚合，可以挪到应用程序处理

优化limit分页

limit偏移量大的时候，查询效率较低。
方案：
记录上一次查询的最大ID，下次查询时直接根据ID来查询（还是使用limit查询，不过加一个where条件，id > ID）

优化union

union all 的效率高于union。
union all 会把重复数据筛选出来，但查询效率比union高