mysql程序员MySQL数据库

MySQL 数据库规范--开发篇

2017-03-30  本文已影响296人  markfork

目录


1.sql语句编写
2.explain 工具的使用--重点

1.sql语句编写


SQL编写

1.执行大的delete、update、insert操作要慎重,特别是对业务繁忙的系统,要尽量避免对线上业务产生影响。
  解决办法是:大操作切割为小操作,使用limit子句限制每次操作的记录数,也可以利用一些日期字段基于更小粒度的时间范围进行操作。

2.避免使用select * 语句,select语句之用于获取需要的字段。

3.使用预编译语句,可以提高性能并且防范 sql注入 攻击。

4.一般情况下update,delete 语句中不要使用limit。

5.where 条件语句中必须使用合适的类型,避免mysql进行隐式转换。

6.insert into 必须显式指明字段名称,不要使用insert into table()。

7.避免在sql 语句中进行数学运算或函数运算,避免将业务逻辑和数据存储耦合在一起。

8.insert 语句如果使用批量提交,如insert into table values(),()...那么values 的个数不应过多。一次性提交过多记录,会导致I/O紧张,出现慢查询。

9.避免使用存储过程、触发器、函数等,这些特性会将业务逻辑与数据库耦合在一起,并且MySQL的存储过程,触发器,函数中可能存在bug。

10.尽量避免使用子查询,连接。尽量将子查询转化为连接查询,mysql 查询优化器会优化连接查询,但连接的表要尽可能的少,如果很多,可以考虑反范式设计。即对设计阶段做一些改造。

11.使用合理的sql语句以减少与数据库的交互次数。

12.建议使用合理的分页技术以提高操作效率。

2.explain 工具的使用


explain工具的作用

1.使用 explain 工具可以确认执行计划是否良好,查询是否走了合理的索引。
2.不同版本MySQL 优化器各有不同,一些优化规则随着版本的发展可能有变化,
  查询的执行计划随着数据的变化也可能发生变化,这类情况就需要使用explain 来验证自己的判断。

explain 工具实操

执行如下脚本,观察控制台输出

explain select name from test where id = 32;

注意数据表使用如下脚本:

CREATE TABLE `test` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=41 DEFAULT CHARSET=utf8;

table name = test、column1 = id、column2 = name.

执行结果如下所示:

屏幕快照 2017-03-30 上午10.36.34.png

下面详细阐述explain 输出的各项内容:

id:

包含一组数字,表示查询中执行 select子句 或操作表的顺序。
如果 id 相同,则执行顺序由上到下

select_type:

表示查询中每个 select 子句的类型(是简单还是复杂)输出结果类似如下:
1.simple
查询中不包含子查询或者union
2.primary
查询中若包含任何复杂子查询,最外层查询被标记为primary
3.subquery
在select 或 where 列表中包含了子查询,则该查询被标记为subquery
4.derived
在from列表中包含的子查询被标记为derived(衍生)
5.union
若第二个select出现在union之后,则被标记为derived。
6.union result
从union表中获取结果的select将被标记为 union result。
select_type 只需要了解分类即可,这个信息并不是最有价值的。

type:最有价值信息之一

type表示 MySQL 在表中找到所需行的方式,又称为“访问类型”,常见的类型如下所示:
all、index、range、ref、eq_ref、const,system,null
以上类型,由左至右,由最差到最好。
all: Full Table Scan,MySQL 将遍历全表以找到匹配的行。
index:Full Index Scan,index 与 all 区别为index类型只遍历索引树。假设表中有主键字段id,则select id from table_name;type即为Full Index Scan。
range:索引扫描范围,对索引的扫描开始于某一点,返回匹配的域或行,常见于between、<、>等的查询。
ref:非唯一性索引扫描,将返回匹配某个单独值得所有行。常见于使用非唯一索引或唯一索引的非唯一前缀的查找。
eq_ref:唯一性索引扫描,对于每个索引键表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
const、system:当MySQL对查询的某部分进行优化,并转化为一个常量时,可使用这些类型进行访问。如果主键置于where列表中,MySQL就能将该查询转换为一个常量,system是const
的一个特例,当查询的表只有一行的情况下,即可使用system。
null:MySQL 在优化过程中分解语句,执行时甚至不用访问表或索引,举例如下:
explain select * from (select * from t1 where id = 1)d1;

possible_keys

possible_keys 将指出MySQL能使用哪个索引在表中找到行,查询涉及的字段上若存在索引,则该索引将被列出,但不一定会被查询使用。

key:最有价值信息之二

key 将显示MySQL在查询中实际使用到的索引,若没有使用索引,则显示为null。查询中若使用到了覆盖索引,则该索引仅仅出现在 key 列表中,possible_keys中并不显示。

key_len

key_len表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。

ref

ref表示上述表的连接匹配条件,即哪些列或常亮被用于查找索引列上的值。

rows:最有价值信息之三

rows 表示MySQL根据表统计信息及索引选用的情况, 估算查找所需记录需要读取的行数。使用到索引一般情况下会使得rows的值降低。

Extra:最有价值信息之四

Extra 包含不适合在其他列中显示但十分重要的额外信息。可能包如下4种信息。
1.Using index
该值表示相应的select操作中使用到了覆盖索引,包含满足查询需要的数据的索引称为覆盖索引。
2.Using where
如果查询未能使用索引,则Using where 的作用只是提醒我们 MySQL 将用where 子句来过滤结果集。
3.Using temporary
表示MySQL需要使用临时表来存储结果集,常见于order by 与 group by,事实上group by会进行隐式的order by。
如果我们在group by 时利用索引分组(其实包含排序的过程)排序,则可以提高性能,因为不会此时查询输出里没有了Using temporary,Using filesort。

4.Using filesort
Using filesort 即文件排序,MySQL 中将无法使用索引完成的排序操作,称为文件排序。

上文篇幅有点长,但都是必须了解的概念。最有价值信息是我们判断sql语句执行是否高效的基准,了解四个最有价值信息是最重要的。

继续演示explain的使用,使用上文的评判标准来看下语句的执行效率:
1.主键查询

主键查询

上述为主键查询的explain信息
type = const 效率很高
key = primary 实际使用的索引为主键
rows = 1 查找的记录数为1
extra = null ,没有任何额外信息
总体来说,性能是极高。

2.主键范围查询

主键范围查询

上述为主键范围查询的explain信息
type =range 范围查询,效率不是最低
key = primary 实际使用的索引为主键
rows = 7 查找的记录数为7
extra = Using where ,最终使用where 做结果集过滤,未使用到覆盖索引。
总体来说,性能是很高。

3.未带索引查询

未带索引查询

如上图所示,name 并未做索引。
type =ALL Full Table Scan 全表查询
key =NULL 未使用索引
rows = 7 10数据库中所有记录
extra = Using where ,最终使用where 做结果集过滤,未使用到覆盖索引。
总体来说,性能极差。(这也是我司内部deviceId接口出问题的终极原因)。

4.未带索引的分组查询

未带索引的分组查询

如上图所示,name 并未做索引。
type =ALL Full Table Scan 全表查询
key =NULL 未使用索引
rows = 7 10数据库中所有记录
extra = Using where ,最终使用where 做结果集过滤,未使用到覆盖索引。并使用到了temporary,filesort 临时表与文件查询。
总体来说,性能极差。

5.带索引的分组查询

我们现在为4与3中 name 创建索引,再来看看分析结果
创建索引脚本如下
alter table test add index idx_name(name);

name 被索引之后的效果
再运行3 和 4中的查询语句
结果如下图所示:
非分组带索引查询
type =ref 非唯一索引扫描,效率不是最低
key =name 实际使用的索引name索引(注意:idx_name与name都是在name字段上建立的索引)。
rows = 1 查找的记录数为1
extra = Using index ,最终使用到覆盖索引。
总体来说,查询性能是极高的。
索引分组查询
type =range 范围扫描,效率不是最低
key =name 实际使用的索引name索引(注意:idx_name与name都是在name字段上建立的索引)。
rows = 1 查找的记录数为1
extra = Using index ,最终使用where 做结果集过滤,使用到覆盖索引。
总体来说,查询性能是极高的。

当然上述演示比较简单,也不是非常具备实战色彩,对于explain的使用,我们还应在更多的数据库操作场景中多多使用,这是sql调优的利器。为我们后期的调优减轻了负担,可以说如果在这一步做好了sql脚本的设计,那么后期关于 sql调优 问题会非常少。

博客搬家:[大坤的个人博客]http://markfork.com/)
欢迎评论哦~

上一篇下一篇

猜你喜欢

热点阅读