MySQL 数据库规范--开发篇

2017-03-30 本文已影响296人 markfork

1.sql语句编写

SQL编写

1.执行大的delete、update、insert操作要慎重，特别是对业务繁忙的系统，要尽量避免对线上业务产生影响。
  解决办法是：大操作切割为小操作，使用limit子句限制每次操作的记录数，也可以利用一些日期字段基于更小粒度的时间范围进行操作。

2.避免使用select * 语句，select语句之用于获取需要的字段。

3.使用预编译语句，可以提高性能并且防范 sql注入 攻击。

4.一般情况下update,delete 语句中不要使用limit。

5.where 条件语句中必须使用合适的类型，避免mysql进行隐式转换。

6.insert into 必须显式指明字段名称，不要使用insert into table()。

7.避免在sql 语句中进行数学运算或函数运算，避免将业务逻辑和数据存储耦合在一起。

8.insert 语句如果使用批量提交，如insert into table values(),()...那么values 的个数不应过多。一次性提交过多记录，会导致I/O紧张，出现慢查询。

9.避免使用存储过程、触发器、函数等，这些特性会将业务逻辑与数据库耦合在一起，并且MySQL的存储过程，触发器，函数中可能存在bug。

10.尽量避免使用子查询，连接。尽量将子查询转化为连接查询，mysql 查询优化器会优化连接查询，但连接的表要尽可能的少，如果很多，可以考虑反范式设计。即对设计阶段做一些改造。

11.使用合理的sql语句以减少与数据库的交互次数。

12.建议使用合理的分页技术以提高操作效率。

2.explain 工具的使用

explain工具的作用

1.使用 explain 工具可以确认执行计划是否良好，查询是否走了合理的索引。
2.不同版本MySQL 优化器各有不同，一些优化规则随着版本的发展可能有变化，
  查询的执行计划随着数据的变化也可能发生变化，这类情况就需要使用explain 来验证自己的判断。

explain 工具实操

执行如下脚本，观察控制台输出

explain select name from test where id = 32;

注意数据表使用如下脚本：

CREATE TABLE `test` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `name` varchar(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=41 DEFAULT CHARSET=utf8;

table name = test、column1 = id、column2 = name.

执行结果如下所示：

屏幕快照 2017-03-30 上午10.36.34.png

下面详细阐述explain 输出的各项内容：

id:

包含一组数字，表示查询中执行 select子句或操作表的顺序。
如果 id 相同，则执行顺序由上到下。

select_type:

表示查询中每个 select 子句的类型(是简单还是复杂)输出结果类似如下：
1.simple
查询中不包含子查询或者union
2.primary
查询中若包含任何复杂子查询，最外层查询被标记为primary
3.subquery
在select 或 where 列表中包含了子查询，则该查询被标记为subquery
4.derived
在from列表中包含的子查询被标记为derived(衍生)
5.union
若第二个select出现在union之后，则被标记为derived。
6.union result
从union表中获取结果的select将被标记为 union result。
select_type 只需要了解分类即可，这个信息并不是最有价值的。

type:最有价值信息之一

type表示 MySQL 在表中找到所需行的方式，又称为“访问类型”，常见的类型如下所示：
all、index、range、ref、eq_ref、const,system,null
以上类型，由左至右，由最差到最好。
all: Full Table Scan,MySQL 将遍历全表以找到匹配的行。
index:Full Index Scan,index 与 all 区别为index类型只遍历索引树。假设表中有主键字段id,则select id from table_name；type即为Full Index Scan。
range:索引扫描范围，对索引的扫描开始于某一点，返回匹配的域或行，常见于between、<、>等的查询。
ref:非唯一性索引扫描，将返回匹配某个单独值得所有行。常见于使用非唯一索引或唯一索引的非唯一前缀的查找。
eq_ref:唯一性索引扫描，对于每个索引键表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
const、system:当MySQL对查询的某部分进行优化，并转化为一个常量时，可使用这些类型进行访问。如果主键置于where列表中，MySQL就能将该查询转换为一个常量，system是const
的一个特例，当查询的表只有一行的情况下，即可使用system。
null:MySQL 在优化过程中分解语句，执行时甚至不用访问表或索引，举例如下：
explain select * from (select * from t1 where id = 1)d1;

possible_keys

possible_keys 将指出MySQL能使用哪个索引在表中找到行，查询涉及的字段上若存在索引，则该索引将被列出，但不一定会被查询使用。

key:最有价值信息之二

key 将显示MySQL在查询中实际使用到的索引，若没有使用索引，则显示为null。查询中若使用到了覆盖索引，则该索引仅仅出现在 key 列表中，possible_keys中并不显示。

key_len

key_len表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度。

ref

ref表示上述表的连接匹配条件，即哪些列或常亮被用于查找索引列上的值。

rows:最有价值信息之三

rows 表示MySQL根据表统计信息及索引选用的情况，估算查找所需记录需要读取的行数。使用到索引一般情况下会使得rows的值降低。

Extra:最有价值信息之四

Extra 包含不适合在其他列中显示但十分重要的额外信息。可能包如下4种信息。
1.Using index
该值表示相应的select操作中使用到了覆盖索引，包含满足查询需要的数据的索引称为覆盖索引。
2.Using where
如果查询未能使用索引，则Using where 的作用只是提醒我们 MySQL 将用where 子句来过滤结果集。
3.Using temporary
表示MySQL需要使用临时表来存储结果集，常见于order by 与 group by，事实上group by会进行隐式的order by。
如果我们在group by 时利用索引分组(其实包含排序的过程)排序，则可以提高性能，因为不会此时查询输出里没有了Using temporary,Using filesort。

4.Using filesort
Using filesort 即文件排序，MySQL 中将无法使用索引完成的排序操作，称为文件排序。

上文篇幅有点长，但都是必须了解的概念。最有价值信息是我们判断sql语句执行是否高效的基准，了解四个最有价值信息是最重要的。

继续演示explain的使用，使用上文的评判标准来看下语句的执行效率：
1.主键查询

主键查询

上述为主键查询的explain信息
type ＝ const 效率很高
key ＝ primary 实际使用的索引为主键
rows ＝ 1 查找的记录数为1
extra = null ,没有任何额外信息
总体来说，性能是极高。

2.主键范围查询

主键范围查询

上述为主键范围查询的explain信息
type ＝range 范围查询，效率不是最低
key ＝ primary 实际使用的索引为主键
rows ＝ 7 查找的记录数为7
extra = Using where ,最终使用where 做结果集过滤，未使用到覆盖索引。
总体来说，性能是很高。

3.未带索引查询

未带索引查询

如上图所示，name 并未做索引。
type ＝ALL Full Table Scan 全表查询
key ＝NULL 未使用索引
rows ＝ 7 10数据库中所有记录
extra = Using where ,最终使用where 做结果集过滤，未使用到覆盖索引。
总体来说，性能极差。（这也是我司内部deviceId接口出问题的终极原因）。

4.未带索引的分组查询

未带索引的分组查询

如上图所示，name 并未做索引。
type ＝ALL Full Table Scan 全表查询
key ＝NULL 未使用索引
rows ＝ 7 10数据库中所有记录
extra = Using where ,最终使用where 做结果集过滤，未使用到覆盖索引。并使用到了temporary,filesort 临时表与文件查询。
总体来说，性能极差。

5.带索引的分组查询

我们现在为4与3中 name 创建索引，再来看看分析结果
创建索引脚本如下
alter table test add index idx_name(name);

name 被索引之后的效果
再运行3 和 4中的查询语句
结果如下图所示：
非分组带索引查询
type ＝ref 非唯一索引扫描，效率不是最低
key ＝name 实际使用的索引name索引（注意：idx_name与name都是在name字段上建立的索引）。
rows ＝ 1 查找的记录数为1
extra = Using index ,最终使用到覆盖索引。
总体来说，查询性能是极高的。
索引分组查询
type ＝range 范围扫描，效率不是最低
key ＝name 实际使用的索引name索引（注意：idx_name与name都是在name字段上建立的索引）。
rows ＝ 1 查找的记录数为1
extra = Using index ,最终使用where 做结果集过滤，使用到覆盖索引。
总体来说，查询性能是极高的。

当然上述演示比较简单，也不是非常具备实战色彩，对于explain的使用，我们还应在更多的数据库操作场景中多多使用，这是sql调优的利器。为我们后期的调优减轻了负担，可以说如果在这一步做好了sql脚本的设计，那么后期关于 sql调优问题会非常少。

博客搬家：[大坤的个人博客]http://markfork.com/)
欢迎评论哦~