5. 查询缓存和索引

2020-11-18 本文已影响0人 BeautifulSoulpy

1. 查询缓存

查询缓存（ Query Cache ）原理
缓存SELECT操作或预处理查询的结果集和SQL语句，当有新的SELECT语句或预
处理查询语句请求，先去查询缓存，判断是否存在可用的记录集，判断标准：与缓
存的SQL语句，是否完全一样，区分大小写
优缺点
不需要对SQL语句做任何解析和执行，当然语法解析必须通过在先，直接从
Query Cache中获得查询结果，提高查询性能
查询缓存的判断规则，不够智能，也即提高了查询缓存的使用门槛，降低其效率；
查询缓存的使用，会增加检查和清理Query Cache中记录集的开销

哪些查询可能不会被缓存
查询语句中加了SQL_NO_CACHE参数
查询语句中含有获得值的函数，包含自定义函数，如：NOW()
CURDATE()、GET_LOCK()、RAND()、CONVERT_TZ()等 对系统数据库的查询：mysql、information_schema 查询语句中使用
SESSION级别变量或存储过程中的局部变量
查询语句中使用了LOCK IN SHARE MODE、FOR UPDATE的语句，查询语
句中类似SELECT …INTO 导出数据的语句
对临时表的查询操作；存在警告信息的查询语句；不涉及任何表或视图的查
询语句；某用户只有列级别权限的查询语句
事务隔离级别为Serializable时，所有查询语句都不能缓存

查询缓存相关的服务器变量
query_cache_min_res_unit：查询缓存中内存块的最小分配单位，默认4k，较
小值会减少浪费，但会导致更频繁的内存分配操作，较大值会带来浪费，会导
致碎片过多，内存不足
query_cache_limit：单个查询结果能缓存的最大值，默认为1M，对于查询结
果过大而无法缓存的语句，建议使用SQL_NO_CACHE
query_cache_size：查询缓存总共可用的内存空间；单位字节，必须是1024
的整数倍，最小值40KB，低于此值有警报
query_cache_wlock_invalidate：如果某表被其它的会话锁定，是否仍然可以
从查询缓存中返回结果，默认值为OFF，表示可以在表被其它会话锁定的场景
中继续从缓存返回数据；ON则表示不允许
query_cache_type：是否开启缓存功能，取值为ON, OFF, DEMAND

SELECT语句的缓存控制
SQL_CACHE：显式指定存储查询结果于缓存之中
SQL_NO_CACHE：显式查询结果不予缓存
query_cache_type参数变量
query_cache_type的值为OFF或0时，查询缓存功能关闭
query_cache_type的值为ON或1时，查询缓存功能打开，SELECT的结果符合
缓存条件即会缓存，否则，不予缓存，显式指定SQL_NO_CACHE，不予缓存，
此为默认值
 query_cache_type的值为DEMAND或2时，查询缓存功能按需进行，显式指
定SQL_CACHE的SELECT语句才会缓存；其它均不予缓存
 参看：https://mariadb.com/kb/en/library/server-system-variables/#query_cache_type
https://dev.mysql.com/doc/refman/5.7/en/query-cache-configuration.html

查询缓存相关的状态变量：SHOW GLOBAL STATUS LIKE ‘Qcache%';
 Qcache_free_blocks：处于空闲状态 Query Cache中内存 Block 数  Qcache_total_blocks：Query Cache 中总Block ，当Qcache_free_blocks
相对此值较大时，可能用内存碎片，执行FLUSH QUERY CACHE清理碎片
 Qcache_free_memory：处于空闲状态的 Query Cache 内存总量
 Qcache_hits：Query Cache 命中次数
 Qcache_inserts：向 Query Cache 中插入新的 Query Cache 的次数，即没
有命中的次数
 Qcache_lowmem_prunes：记录因为内存不足而被移除出查询缓存的查询数
 Qcache_not_cached：没有被 Cache 的 SQL 数，包括无法被 Cache 的 SQL
以及由于 query_cache_type 设置的不会被 Cache 的 SQL语句
 Qcache_queries_in_cache：在 Query Cache 中的 SQL 数量

# 重启服务就会丢失缓存；
MariaDB [hellodb]> set global query_cache_size=1024000;   

MariaDB [hellodb]> show variables like 'query_cache%';
+------------------------------+---------+
| Variable_name                | Value   |
+------------------------------+---------+
| query_cache_limit            | 1048576 |
| query_cache_min_res_unit     | 4096    |
| query_cache_size             | 1024000 |
| query_cache_strip_comments   | OFF     |
| query_cache_type             | ON      |
| query_cache_wlock_invalidate | OFF     |
+------------------------------+---------+

# 永久设置查询缓存；
[root@Centos7 ~]# nano /etc/my.cnf
[mysqld]
query_cache_size=10M

[root@Centos7 ~]# systemctl restart mariadb.service

2. 命中率和内存使用率估算

查询缓存中内存块的最小分配单位query_cache_min_res_unit ： (query_cache_size - Qcache_free_memory) / Qcache_queries_in_cache
查询缓存命中率：Qcache_hits / ( Qcache_hits + Qcache_inserts ) * 100%
查询缓存内存使用率：(query_cache_size – qcache_free_memory) /
query_cache_size * 100%

3. InnoDB存储引擎

InnoDB存储引擎的缓冲池:
通常InnoDB存储引擎缓冲池的命中不应该小于99%
查看相关状态变量：
show global status like 'innodb%read%'\G
Innodb_buffer_pool_reads: 表示从物理磁盘读取页的次数
Innodb_buffer_pool_read_ahead: 预读的次数
Innodb_buffer_pool_read_ahead_evicted: 预读页，但是没有读取就从缓冲池中被替换的页数量，一般用来判断预读的效率
Innodb_buffer_pool_read_requests: 从缓冲池中读取页次数
Innodb_data_read: 总共读入的字节数
Innodb_data_reads: 发起读取请求的次数，每次读取可能需要读取多个页

4. 索引

索引：是特殊数据结构，定义在查找时作为查找条件的字段，在MySQL又称为键key，索引通过存储引擎实现
优点：
索引可以降低服务需要扫描的数据量，减少了IO次数
索引可以帮助服务器避免排序和使用临时表
索引可以帮助将随机I/O转为顺序I/O
缺点：
占用额外空间，影响插入速度

4.1 索引类型：

B+ TREE、HASH、R TREE
聚簇（集）索引、非聚簇索引：数据和索引是否存储在一起
主键索引、二级（辅助）索引
稠密索引、稀疏索引：是否索引了每一个数据项
简单索引、组合索引
左前缀索引：取前面的字符做索引
覆盖索引：从索引中即可取出要查询的数据，性能高

B+Tree索引

B+Tree索引：顺序存储，每一个叶子节点到根结点的距离是相同的；左前缀索
引，适合查询范围类的数据
可以使用B+Tree索引的查询类型：
全值匹配：精确所有索引列，如：姓wang，名xiaochun，年龄30
匹配最左前缀：即只使用索引的第一列，如：姓wang
匹配列前缀：只匹配一列值开头部分，如：姓以w开头的
匹配范围值：如：姓ma和姓wang之间
精确匹配某一列并范围匹配另一列：如：姓wang,名以x开头的
只访问索引的查询

B+Tree索引
B+Tree索引的限制：
如不从最左列开始，则无法使用索引，如：查找名为xiaochun，或姓为g结尾
不能跳过索引中的列：如：查找姓wang，年龄30的，只能使用索引第一列
如果查询中某个列是为范围查询，那么其右侧的列都无法再使用索引：如：姓
wang,名x%,年龄30，只能利用姓和名上面的索引
特别提示：
索引列的顺序和查询语句的写法应相匹配，才能更好的利用索引
为优化性能，可能需要针对相同的列但顺序不同创建不同的索引来满足不同类
型的查询需求

Hash索引

Hash索引：基于哈希表实现，只有精确匹配索引中的所有列的查询才有效，索
引自身只存储索引列对应的哈希值和数据指针，索引结构紧凑，查询性能好
Memory存储引擎支持显式hash索引，InnoDB和MyISAM存储引擎不支持
适用场景：只支持等值比较查询，包括=, <=>, IN()
不适合使用hash索引的场景
不适用于顺序查询：索引存储顺序的不是值的顺序
不支持模糊匹配
不支持范围查询
不支持部分索引列匹配查找：如A，B列索引，只查询A列索引无效

索引

空间数据索引R-Tree（ Geospatial indexing ）
MyISAM支持地理空间索引，可以使用任意维度组合查询，使用特有的函数访
问，常用于做地理数据存储，使用不多
InnoDB从MySQL5.7之后也开始支持
全文索引(FULLTEXT)
在文本中查找关键词，而不是直接比较索引中的值，类似搜索引擎
InnoDB从MySQL 5.6之后也开始支持

5. 查询缓存和索引

1. 查询缓存

2. 命中率和内存使用率估算

3. InnoDB存储引擎

4. 索引

4.1 索引类型：

B+Tree索引

Hash索引

索引

猜你喜欢

热点阅读