【MySQL】MySQL5.7中sys库的说明
Sys库里的数据来源
Sys库所有的数据源来自:performance_schema。目标是把performance_schema的把复杂度降低,让DBA能更好的阅读这个库里的内容。让DBA更快的了解DB的运行情况。
Sys库下有两种表
字母开头: 适合人阅读,显示是格式化的数
x$开头 : 适合工具采集数据,原始类数据
每类表大概介绍
sys_开头是库里的配置表:
sys_config用于sys schema库的配置
视图:
host : 以IP分组相关的统计信息
innodb : innodb buffer 相关信息
io : 数据内不同维度展的IO相关的信息
memory : 以IP,连接,用户,分配的类型分组及总的占用显示内存的使用
metrics : DB的内部的统计值
processlist : 线程相关的信息(包含内部线程及用户连接)
ps_ : 没有工具统计的一些变量(没看出来存在的价值)
schema : 表结构相关的信息,例如: 自增,索引, 表里的每个字段类型,等待的锁等等
session : 用户连接相关的信息
statement : 基于语句的统计信息(重店)
statements_ : 出错的语句,进行全表扫描, 运行时间超长,排序相等(重点)
user_ : 和host_开头的相似,只是以用户分组统计
wait : 等待事件,比较专业,难看懂。
waits : 以IP,用户分组统计出来的一些延迟事件,有一定的参考价值。
Sys库能做什么,那么我们先来看看以下的问题,对于数据库,你有没有以下的疑问?
- 谁使用了最多的资源? 基于IP或是用户?
- 大部分连接来自哪里及发送的SQL情况?
- 机器执行多的SQL语句是什么样?
- 哪个文件产生了最多的IO,它的IO模式是怎么样的?
- 那个表的IO最多?
- 哪张表被访问过最多?
- 哪些语句延迟比较严重?
- 哪些SQL语句使用了磁盘临时表
- 哪张表占用了最多的buffer pool
- 每个库占用多少Buffer pool
- 每个连接分配多少内存?
- MySQL内部现在有多个线程在运行?
要解答上面的这些问题,我们首先需要学习一点基础知识,现在一块看下一些重要的视图结构:
host_summary
字段名 | 意义 |
---|---|
host | 从哪个服务器上连过来。如果是NULL,表示内部的进程 |
Statements | 这台服务器共执行了多少语句(从启动开始统计?) |
Statement_latency | 这台服务器发来等待语句执行的时间 |
Statement_avg_latency | 该服务器等待语句执行的平均时间 |
Table_scans | 该服务器扫描表的次数(非全表) |
File_io | 该服务器IO事件请求的次数 |
File_io_latency | 该服务器请求等待IO的时间 |
Current_connections | 该服务器当前的连接数 |
Total_connections | 该服务器总连接DB共连接多少次 |
Unique_user | 该服务器上有几个不同用户名的账户连接过来 |
Current_memory | 该服务器上当前连接等占用的内存 |
Total_memory_allocated | 该服务器上的请求总共使用的内存 |
Io_global_by_file_by_bytes
字段名 | 意义 |
---|---|
File | 被操作的文件名 |
Count_read | 总共有多少次读 |
Total_read | 总共读了多少字节 |
Avg_read | 平均每次读多少字节 |
Count_write | 总共多少次写 |
Total_written | 总共写了多少字节 |
Avg_write | 平均每次写的字节大学 |
Total | 读和写总共的IO大学 |
Write_pct | 写占total里的百分比 |
User_summary
字段名 | 意义 |
---|---|
User | 客户端连接过来的用户名。如果是NULL,表示内部进程 |
Statements | 该用户执行了多少SQL |
Statement_latency | 该用户执行SQL的总延迟时间 |
Statement_avg_latency | 该用户执行SQL的平均延迟时间 |
Table_scans | 该用户执行SQL时扫描表的次数 |
File_ios | 该用户请求操作用掉的IO |
File_io_latency | 该用户请求操作的IO总延迟时间 |
Current_connections | 该用户当前的连接数 |
Total_connections | 该用户总的连接数 |
Unique_hosts | 该用户从几个唯一的机器连接过来 |
Current_memory | 该用户当前占用的内存 |
Total_memory_allocated | 该用户总共申请到的内存(累加值) |
Memory_global_total
Total_allocated server总共分配出去的内存(应该是server层)
Memory_by_thread_by_current_bytes
字段名 | 意义 |
---|---|
Thread_id | 内部线程ID可以和session中的thd_id关联 |
User | 这个线程是哪个用户创建的 |
Current_count_used | 当前使用的内存块还没有释放 |
Current_allocated | 当前分配的内存大小(字节)而且没有被释放出来 |
Current_avg_alloc | 平均分配的blocks |
Current_max_alloc | 当前线程分配的最多内存 |
Total_allocated | 当前连总共分配的内存大小 |
Statement_analysis
字段名 | 意义 |
---|---|
Query | 归一化的SQL样子 |
Db | 在哪个DB中执行。NULL表示在任何DB |
Full_scan | 全表扫描的次数 |
Exec_count | 该SQL执行的总次数 |
Err_count | 发生错误的次数 |
Warn_count | 发生警告的次数 |
Total_latency | 总共发生延迟的实际 |
Max_latency | 最大延迟时间 |
Avg_latency | 平均延迟时间 |
Lock_latency | 因锁等待占用的总时间 |
Rows_sent | 执行该SQL返回的总行数 |
Rows_sent_avg | 执行该SQL平均返回的行数 |
Tmp_tables | 该SQL形成内存临时表的总次数 |
Tmp_disk_tables | 该SQL形成文件临时表的总次数 |
Rows_sorted | 该SQL总共排序的行数 |
Sort_merge_passes | 用于排序中合并的总次数 |
Digest | 该语句的hash值 |
First_screen | 该SQL最早出现的时间 |
Last_screen | 该SQL最近出现的时间 |
Processlist && session
字段名 | 意义 |
---|---|
Thd_id | 内部线程ID |
Conn_id | 连接的ID,对应show processlist中的ID列 |
User | 该线程创建的用户名 |
Db | 连接的DB,如果NULL表示后台线程 |
Command | Client发起命令的类型提示 |
State | 命令的状态 |
Time | 基于上面的state停留的实际 |
Current_statement | 该线程执行的语句 |
Statement_latency | 语句运行总共占用时间 |
Progress | 该语句运行完成的百分比 |
Lock_latency | 该语句用于锁等待的时间 |
Rows_examined | 该语句扫描的次数 |
Rows_send | 该语句返回的行数 |
Rows_affected | 该语句影响到的行数(写入语句) |
Tmp_tables | 形成内存临时表的次数 |
Tmp_disk_tables | 形成磁盘临时表的次数 |
Full_scan | 全表扫描的次数 |
Trx_state | 当前事务的状态 |
Pid | 对应到系统里的pid |
Program_name | 连接进来的标识名 |
Session和processlist视图基本一样,只是把后台线程过滤掉。
Innodb_buffer_stats_by_schema
字段名 | 意义 |
---|---|
Object_schema | 库名 |
Allocated | 基于库分配的buffer pool大小 |
Data | 基于schema实际缓存的数据大小 |
Pages | 当前schema缓存的page数 |
Pages_hashed Buffer | pool中进行hash 索引的page |
Pages_old | Buffer pool中的旧页,可能被置换出去 |
Rows_cached | Buffer pool中以行为单位的缓存 |
Innodb_buffer_stats_by_table
和innodb_buffer_stats_by_schema基本一致。只是比上面多了个object_name指定表名。
- 谁使用了最多的资源? 基于IP或是用户?
对于该问题可以从host, user, io三个方面去了解,大概谁的请求最多。对于使用资源问题可以直接从下面四个视图里有一个大概的了解。
Select*from host_summary limit 1\G
Select*from io_global_by_file_by_bytes limit 1\G
Select*from user_summary limit 1\G
Select*from memory_global_total;
注意内存部分,不包括innodbbuffer pool。只是server 层申请的内存
- 大部分连接来自哪里及发送的SQL情况
查看当前连接情况:
select host, current_connections,statements from host_summary;
查看当前正在执行的SQL:
select conn_id, user, current_statement, last_statement from session;
- 机器执行最多的SQL语句是什么样?
例如查一下系统里执行最多的TOP 10 SQL。
SQL如下:
select * from statement_analysis order byexec_count desc limit 10\G;
- 哪张表的IO最多?哪张表访问次数最多
select * from io_global_by_file_by_byteslimit 10;(参见上面表格说明)
哪张表访问次数最多,可以参考上面先查询执行最多的语句,然后查找对应的表。
SQL如下:
select * from statement_analysis order byexec_count desc limit 10\G;
- 哪些语句延迟比较严重
statement_analysis中avg_latency的最高的。(参考上面写法)
SQL语句:
select * from statement_analysis order byavg_latency desc limit 10;
- 哪些SQL语句使用了磁盘临时表
利用statement_analysis 中tmp_tables ,tmp_disk_tables 进行计算。(参考上面写法)
参考SQL:
select db, query, tmp_tables,tmp_disk_tables from statement_analysiswhere tmp_tables>0 or tmp_disk_tables >0 order by(tmp_tables+tmp_disk_tables) desc limit 20;
- 哪张表占用了最多的buffer pool
例如查询在buffer pool中占用前10的表。
SQL如下:
select * from innodb_buffer_stats_by_tableorder by pages desc limit 10;
- 每个库占用多少buffer pool
SQL如下:
select * frominnodb_buffer_stats_by_schema;
- 每个连接分配多少内存
利用session表和memory_by_thread_by_current_bytes分配表进行关联查询。
SQL如下:
select b.user, current_count_used,current_allocated, current_avg_alloc, current_max_alloc,total_allocated,current_statement from memory_by_thread_by_current_bytes a,session b where a.thread_id = b.thd_id;
- MySQL内部现在有多个线程在运行
MySQL内部的线程类型及数量:
select user, count(*) from processlistgroup by user;
摘自
https://blog.csdn.net/yanzongshuai/article/details/73441158