mysql

MySQL——优化

2021-01-11  本文已影响0人  小波同学

一、应用优化

在实际生产环境中,由于数据库本身的性能局限,就必须要对前台的应用进行一些优化,来降低数据库的访问压力。

1.1、使用连接池

对于访问数据库来说,建立连接的代价是比较昂贵的,因为我们频繁的创建关闭连接,是比较耗费资源的,我们必须要使用数据库连接池,以提高访问的性能。

1.2、减少对MySQL的访问

避免对数据进行重复检索

在编写应用代码时,需要能够理清对数据库的访问逻辑。能够一次连接就获取到结果的,就不用两次连接,这样可以大大减少对数据库无用的重复请求。

比如 ,需要获取书籍的id 和name字段 , 则查询如下:

select id , name from tb_book;

之后,在业务逻辑中有需要获取到书籍状态信息, 则查询如下:

select id , status from tb_book;

这样,就需要向数据库提交两次请求,数据库就要做两次查询操作。其实完全可以用一条SQL语句得到想要的结果。

select id, name , status from tb_book;
增加cache层

在应用中,我们可以在应用中增加 缓存 层来达到减轻数据库负担的目的。缓存层有很多种,也有很多实现方式,只要能达到降低数据库的负担又能满足应用需求就可以。

因此可以部分数据从数据库中抽取出来放到应用端以文本方式存储, 或者使用框架(Mybatis, Hibernate)提供的一级缓存/二级缓存,或者使用redis数据库来缓存数据,还可以使用基于Guava Cache的JVM级别的内存缓存。

1.3、负载均衡

负载均衡是应用中使用非常普遍的一种优化方法,它的机制就是利用某种均衡算法,将固定的负载量分布到不同的服务器上, 以此来降低单台服务器的负载,达到优化的效果。

利用MySQL复制分流查询

通过MySQL的主从复制,实现读写分离,使增删改操作走主节点,查询操作走从节点,从而可以降低单台服务器的读写压力。

采用分布式数据库架构

分布式数据库架构适合大数据量、负载高的情况,它有良好的拓展性和高可用性。通过在多台服务器之间分布数据,可以实现在多台服务器之间的负载均衡,提高访问效率。

可以采用MySQL的MMM或MHA架构,业界成熟和应用比较广的MHA架构

MySQL集群高可用架构:https://www.jianshu.com/p/14d1c07820ce

二、Mysql中查询缓存优化

写在前面:查询缓存从MySQL 5.7.20开始已被弃用,并在MySQL 8.0中被删除。

考虑到当前的局限性,在MySQL 5.7的生存期内将继续支持查询缓存。MySQL 8.0将不支持查询缓存,并且鼓励用户升级以使用服务器端查询重写或ProxySQL作为中间人缓存。

MySQL 8.0:不再支持查询缓存

2.1、概述

Query cache 作用于整个 MySQL,主要用来缓存 MySQL 中的查询结果集,也就是一条SQL语句执行的结果集,所以仅仅只能针对select语句。当我们打开了 Query Cache 功能,MySQL在接受到一条select语句的请求后,如果命中缓存,也就是说所需结果集已经在缓存中了,后面一系列步骤都不用再执行,直接从缓存拿到结果集返回给客户端,可以极大的提高查询性能!

开启Mysql的查询缓存,当执行完全相同的SQL语句的时候,服务器就会直接从缓存中读取结果,当数据被修改,之前的缓存会失效,修改比较频繁的表不适合做查询缓存。

2.2、执行步骤

sql 查询数据库 执行步骤如下:


2.3、查询缓存配置

SHOW VARIABLES LIKE 'have_query_cache';
SHOW VARIABLES LIKE 'query_cache_type';
SHOW VARIABLES LIKE 'query_cache_size';
SHOW STATUS LIKE 'Qcache%';

各个变量的含义如下:

参数 含义
Qcache_free_blocks 查询缓存中的可用内存块数
Qcache_free_memory 查询缓存的可用内存量
Qcache_hits 查询缓存命中数
Qcache_inserts 添加到查询缓存的查询数
Qcache_lowmen_prunes 由于内存不足而从查询缓存中删除的查询数
Qcache_not_cached 非缓存查询的数量(由于 query_cache_type 设置而无法缓存或未缓存)
Qcache_queries_in_cache 查询缓存中注册的查询数
Qcache_total_blocks 查询缓存中的块总数

2.4、开启查询缓存

MySQL的查询缓存默认是关闭的,需要手动配置参数 query_cache_type , 来开启查询缓存。
query_cache_type 该参数的可取值有三个 :

含义
OFF 或 0 查询缓存功能关闭
ON 或 1 查询缓存功能打开,SELECT的结果符合缓存条件即会缓存,
否则,不予缓存,显式指定SQL_NO_CACHE,不予缓存
DEMAND 或 2 查询缓存功能按需进行,显式指定 SQL_CACHE 的SELECT
语句才会缓存;其它均不予缓存

在 /etc/my.cnf 配置中,增加以下配置 :

#开启Mysql的查询缓存,决定是否缓存查询结果。这个变量有三个取值:0,1,2,分别代表了off、on、demand。
query_cache_type = 1

配置完毕之后,重启服务既可生效 ;
然后就可以在命令行执行SQL语句进行验证 ,执行一条比较耗时的SQL语句,然后再多执行几次,查看后面几次的执行时间;获取通过查看查询缓存的缓存命中数,来判定是否走查询缓存。

2.5、查询缓存SELECT选项

可以在SELECT语句中指定两个与查询缓存相关的选项 :

例子:

SELECT SQL_CACHE id, name FROM customer;
SELECT SQL_NO_CACHE id, name FROM customer;

2.6、查询缓存失效的情况

SQL1 : select count(*) from tb_item;
SQL2 : Select count(*) from tb_item;
SQL1 : select * from tb_item where updatetime < now() limit 1;
SQL2 : select user();
SQL3 : select database();
select 'A';
select * from information_schema.engines;

三、MySQL内存管理及优化

3.1、内存优化原则

3.2、MyISAM 内存优化

myisam存储引擎使用 key_buffer 缓存索引块,加速myisam索引的读写速度。对于myisam表的数据块,mysql没有特别的缓存机制,完全依赖于操作系统的IO缓存。

key_buffer_size

key_buffer_size决定MyISAM索引块缓存区的大小,直接影响到MyISAM表的存取效率。可以在MySQL参数文件中设置key_buffer_size的值,对于一般MyISAM数据库,建议至少将1/4可用内存分配给key_buffer_size。

在/etc/my.cnf 中做如下配置:

key_buffer_size=512M
read_buffer_size

如果需要经常顺序扫描myisam表,可以通过增大read_buffer_size的值来改善性能。但需要注意的是read_buffer_size是每个session独占的,如果默认值设置太大,就会造成内存浪费。

read_rnd_buffer_size

对于需要做排序的myisam表的查询,如带有order by子句的sql,适当增加 read_rnd_buffer_size 的值,可以改善此类的sql性能。但需要注意的是read_rnd_buffer_size 是每个session独占的,如果默认值设置太大,就会造成内存浪费。

3.3、InnoDB 内存优化

innodb用一块内存区做IO缓存池,该缓存池不仅用来缓存innodb的索引块,而且也用来缓存innodb的数据块。

在内部,innodb 缓存池逻辑上由 free list、flush list 和 lru list 组成:

innodb 使用的 lru 算法与 myisam 的“中点插入策略”lru算法很类似,大致原理是:将 lru list 分为 young sublist 和 old sublist,数据从磁盘读入时,会将该缓存块插入到 lru list 的“中点”,即 old sublist 的头部;经过一定时间的访问(由 innodb_old_blocks_time 系统参数决定),该数据块将会由 old sublist 转移到 young sublist 的头部,也就是整个lru list 的头部;随着时间推移,young sublist 和 old sublist 中较少被访问的缓存块将从各自链表的头部逐渐向尾部移动;需要淘汰数据块时,优先从链表尾部淘汰。这种设计同样是为了防止偶尔被访问的索引块将访问频繁的热块淘汰。

innodb_buffer_pool_size

该变量决定了 innodb 存储引擎表数据和索引数据的最大缓存区大小。在保证操作系统及其他程序有足够内存可用的情况下,innodb_buffer_pool_size 的值越大,缓存命中率越高,访问InnoDB表需要的磁盘I/O 就越少,性能也就越高。

在一个专用的数据库服务器上可以将 80% 的物理内存分配给 InnoDB buffer pool ,需要注意避免设置过大而导致页的交换。

#查看 buffer pool 的使用情况 
show global status like '%Innodb_buffer_pool%';

#计算 InnoDB 缓存池的命中率,如果命中率太低,则应该考虑扩充内存、增加 innodb_buffer_pool_size 的值
(1-Innodb_buffer_pool_reads/Innodb_buffer_pool_read_requests)*100

​参考设置:

1)物理内存小于 1 GB
innodb_buffer_pool_size=128M
innodb_log_file_size=48M

2)物理内存为 1 GB ~ 4GB
innodb_buffer_pool_size=物理内存*0.5
innodb_log_file_size=128M


3)物理内存大于 4 GB
innodb_buffer_pool_size=物理内存*0.75
innodb_log_file_size=1024M
innodb_log_buffer_size

决定了innodb重做日志缓存的大小,对于可能产生大量更新记录的大事务,增加innodb_log_buffer_size的大小,可以避免innodb在事务提交前就执行不必要的日志写入磁盘操作。

innodb_log_buffer_size=10M
innodb_old_blocks_pct

​innodb_old_blocks_pct (old sublist 的比例),可以根据 InnoDB Monitor的输出信息来调整 innodb_old_blocks_pct 的值。如果 youngs/s 的值很低,可能需要适当增大innodb_old_blocks_pct 的值或减少 innodb_old_blocks_time 的值。

show engine innodb status\G;

*************************** 1. row ***************************
  Type: InnoDB
  Name:
Status:
=====================================
......
Pages made young 0, not young 0
0.00 youngs/s, 0.00 non-youngs/s
......

当然,调整 old_sublist 的比例由系统参数 innodb_old_blocks_pct 决定,其取值范围是 5 ~ 95, 默认值是 37。

通过以下命令可以查看其当前设置:

show global variables like '%innodb_old_blocks_pct%';
innodb_old_blocks_time

​一个缓存数据块被插入到 midpoint(old sublist)后,至少要在 old sublist 停留超过 innodb_old_blocks_time(ms)后,才有可能被转移到 young sublist。

​可以根据 InnoDB Monitor的输出信息来调整 innodb_old_blocks_time 的值。在进行表扫描时,如果 non-youngs/s 很低,youngs/s 很高,就应该考虑将 innodb_old_blocks_time 适当调大,以防止表扫描将真正的热数据淘汰。

show engine innodb status\G;

*************************** 1. row ***************************
  Type: InnoDB
  Name:
Status:
=====================================
......
Pages made young 0, not young 0
0.00 youngs/s, 0.00 non-youngs/s
......
innodb_buffer_pool_instances

​适当增加此参数的值,可以降低并发导致的内部缓存访问冲突,改善性能。 InnoDB 缓存系统会将 innodb_buffer_pool_size 的大小平分为 innodb_buffer_pool_instances 个 buffer pool。

innodb_max_dirty_pages_pct
innodb_io_capacity

​* 1、代表磁盘系统的 I/O 能力,对于转速较低的磁盘;如 7200RPM 的磁盘,可将 innodb_io_capacity 的值降低到 100;而对于固态硬盘和由多个磁盘组成的盘阵,innodb_io_capacity 的值可以适当增大。对于固态硬盘来说,建议设置为 2000 或者更高。

innodb_doublewrite

对于要求超高性能,有能容忍极端情况下少量数据丢失的应用,可以通过在配置文件中增加 innodb_doublewrite=0 参数设置来关闭 innodb_doublewrite,以尽量满足性能方面的要求。

join_buffer_size & sort_buffer_size

​如果 Sort_merge_passes 的值很大,可以考虑调整参数 sort_buffer_size 的值来增大排序缓存区,以改善带有 order by 子句或 group 子句 SQL 的性能。

show global status like 'Sort_merge_passes';

注意:join_buffer_size 和 sort_buffer_size 都是面向用户服务线程分配的,如果设置过大造成内存浪费,甚至导致内存交换。尤其是 join_buffer_size,如果是多表关联的复杂查询,还可能会分配多个 join buffer,因此最好是设置较小的全局 join_buffer_size,而对需要做复杂连接操作的 session 单独设置较大的 join_buffer_size。

四、MySQL并发参数调整

从实现上来说,MySQL Server 是多线程结构,包括后台线程和客户服务线程。多线程可以有效利用服务器资源,提高数据库的并发性能。在Mysql中,控制并发连接和线程的主要参数包括 max_connections、back_log、thread_cache_size、table_open_cahce。

4.1、max_connections

采用max_connections 控制允许连接到MySQL数据库的最大数量,默认值是 151。如果状态变量 connection_errors_max_connections 不为零,并且一直增长,则说明不断有连接请求因数据库连接数已达到允许最大值而失败,这是可以考虑增大max_connections 的值。

Mysql 最大可支持的连接数,取决于很多因素,包括给定操作系统平台的线程库的质量、内存大小、每个连接的负荷、CPU的处理速度,期望的响应时间等。在Linux 平台下,性能好的服务器,支持 500-1000 个连接不是难事,需要根据服务器性能进行评估设定。

注意:每一个 session 操作 MySQL 数据库表都需要占用文件描述符,数据库连接本身也要占用文件描述符,因此在增大 max_connections 值时,也要注意评估 open_files_limit 的设置是否够用。

4.2、back_log

back_log 参数控制MySQL监听TCP端口时设置的积压请求栈大小。如果MySql的连接数达到max_connections时,新来的请求将会被存在堆栈中,以等待某一连接释放资源,该堆栈的数量即back_log,如果等待连接的数量超过back_log,将不被授予连接资源,将会报错。5.6.6 版本之前默认值为50,之后的版本默认为50 +(max_connections / 5), 但最大不超过900。

如果需要数据库在较短的时间内处理大量连接请求, 可以考虑适当增大back_log 的值。

4.3、table_open_cache

4.4 thread_cache_size

为了加快连接数据库的速度,MySQL 会缓存一定数量的客户服务线程以备重用,通过参数 thread_cache_size 可控制 MySQL 缓存客户服务线程的数量。

通过计算线程 cache 的失效率 Threads_created/Connections 来调整 thread_cache_size 值。该值越接近1,说明线程 cache 命中率越低,应该考虑 适当增加 thread_cache_size 的值。

innodb_lock_wait_timeout

参考:
MySQL集群高可用架构

https://blog.51cto.com/11286233/2043902

https://www.cnblogs.com/Mr-Echo/p/12155461.html

https://blog.csdn.net/qq_33033819/article/details/106581728

https://blog.csdn.net/qq_33033819/article/details/106581756

上一篇 下一篇

猜你喜欢

热点阅读