十五、系统调优

2020-01-27 本文已影响0人胖虎喜欢小红

简介：系统优化其本质是系统在提供服务的同时，承受压力过大需进行参数调优

1、查看平均负载

系统负载System Load：系统CPU繁忙程度的度量，即有多少进程在等待被CPU调度,平均负载（Load Average）：一段时间内系统的平均负载，这个一段时间一般取1分钟、5分钟、15分钟

[root@linux_server ~]# uptime
10:48:38 up 5 min,  2 users,  load average: 0.05, 0.08, 0.05
1分钟平均负载，5分钟平均负载，15分钟平均负载分别是0.05,0.08,0.05

[root@linux_server ~]# w    #查看都有哪些用户连接服务器
 10:49:59 up 7 min,  2 users,  load average: 0.01, 0.06, 0.05
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root     tty1                      10:43    6:07   0.01s  0.01s -bash
root     pts/0    192.168.94.1     10:48    7.00s  0.02s  0.01s w

2、查看CPU每隔10min的使用情况

[root@linux_server ~]# yum -y install sysstat     #装完成之后需要等待一会
[root@linux_server ~]# sar 
Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)

08:50:01 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
09:00:01 PM     all      0.25      0.00      0.44      0.78      0.00     98.52
09:10:02 PM     all      0.55      0.00      0.32      0.16      0.00     98.98
Average:        all      0.40      0.00      0.38      0.47      0.00     98.75
-A：所有报告的总和
-u：输出CPU使用情况的统计信息
-v：输出inode、文件和其他内核表的统计信息
-d：输出每一个块设备的活动信息
-r：输出内存和交换空间的统计信息
-b：显示I/O和传送速率的统计信息
-a：文件读写情况
-c：输出进程统计信息，每秒创建的进程数
-R：输出内存页面的统计信息
-y：终端设备活动情况
-w：输出系统交换活动信息

例如，每2秒采样一次，连续采样3次，观察CPU 的使用情况
[root@linux_server ~]# sar -u 2 3
Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)

09:19:21 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
09:19:23 PM     all      0.00      0.00      0.50      0.00      0.00     99.50
09:19:25 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
09:19:27 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
Average:        all      0.00      0.00      0.17      0.00      0.00     99.83
参数详解：
CPU：all 表示统计信息为所有 CPU 的平均值。
%user：显示在用户级别(application)运行使用 CPU 总时间的百分比。
%nice：显示在用户级别，用于nice操作，所占用 CPU 总时间的百分比。
%system：在核心级别(kernel)运行所使用 CPU 总时间的百分比。
%iowait：显示用于等待I/O操作占用 CPU 总时间的百分比。
%steal：管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟 CPU 的百分比。
%idle：显示 CPU 空闲时间占用 CPU 总时间的百分比。
1. 若 %iowait 的值过高，表示硬盘存在I/O瓶颈。
2. 若 %idle 的值高但系统响应慢时，有可能是 CPU 等待分配内存，此时应加大内存容量。
3. 若 %idle 的值持续低于1，则系统的 CPU 处理能力相对较低，表明系统中最需要解决的资源是 CPU。
===================================================================================
例如，每3秒采样一次，连续采样3次，观察内存和交换空间状态
[root@linux_server ~]# sar -r 3 3
Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)

09:20:55 PM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
09:20:58 PM    676148    323548     32.36         0    169548    293372      9.47    136672     91728         0
09:21:01 PM    676148    323548     32.36         0    169548    293372      9.47    136672     91728         0
09:21:04 PM    676148    323548     32.36         0    169548    293372      9.47    136676     91728         0
Average:       676148    323548     32.36         0    169548    293372      9.47    136673     91728         0
参数详解：
输出项说明：
kbmemfree：这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.
kbmemused：这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间.
%memused：这个值是kbmemused和内存总量(不包括swap)的一个百分比.
kbbuffers和kbcached：这两个值就是free命令中的buffer和cache
kbcommit：保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
%commit：这个值是kbcommit与内存总量(包括swap)的一个百分比.
=============================================================================

3.查看进程io使用情况

[root@linux_server ~]# yum -y install iotop
[root@linux_server ~]# iotop
[root@linux_server ~]# iotop -b -n 3 -d 5
--version #显示版本号 
-h, --help #显示帮助信息 
-o, --only #显示进程或者线程实际上正在做的I/O，而不是全部的，可以随时切换按o 
-b, --batch #运行在非交互式的模式 
-n NUM, --iter=NUM #在非交互式模式下，设置显示的次数， 
-d SEC, --delay=SEC #设置显示的间隔秒数，支持非整数值 
-p PID, --pid=PID #只显示指定PID的信息 
-u USER, --user=USER #显示指定的用户的进程的信息 
-P, --processes #只显示进程，一般为显示所有的线程 
-a, --accumulated #显示从iotop启动后每个线程完成了的IO总数 
-k, --kilobytes #以千字节显示 
-t, --time #在每一行前添加一个当前的时间
IO #IO利用率

4.查看内存使用情况

[root@linux_server ~]# vmstat
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 2  0      0 648128   2108 251128    0    0   334    30  122  186  0  1 99  0  0

r: 表示运行和等待CPU时间片的进程数（就是说多少个进程真的分配到CPU），这个值如果长期大于系统CPU个数，说明CPU 不足，需要增加CPU  
b：表示在等待资源的进程数。 
 
2、memory 
swpd：表示切换到内存交换区的内存大小，即虚拟内存已使用的大小（单位KB），如果大于0，表示你的机器物理内存不足 了，如果不是程序内存泄露的原因，那么你该升级内存了或者把耗内存的任务迁移到其他机器。 
free：表示当前空闲的物理内存 
buff：表示baffers cached内存大小，也就是缓冲大小，一般对块设备的读写才需要缓冲 
Cache：表示page cached的内存大小，也就是缓存大小，一般作为文件系统进行缓冲，频繁访问的文件都会被缓存，如果 cache值非常大说明缓存文件比较多，如果此时io中的bi比较小，说明文件系统效率比较好 
 
3、swap 
si：表示有磁盘调入内存，也就是内存进入内存交换区的内存大小；通俗的讲就是 每秒从磁盘读入虚拟内存的大小，如果这 个值大于0，表示物理内存不够用或者内存泄露了，要查找耗内存进程解决掉。
so：表示由内存进入磁盘，也就是由内存交换区进入内存的内存大小。 注意：一般情况下si、so的值都为0，如果si、so的值长期不为0，则说明系统内存不足，需要增加系统内存 
 
4、io 
bi：表示由块设备读入数据的总量，即读磁盘，单位kb/s 
bo：表示写到块设备数据的总量，即写磁盘，单位kb/s 
注意：如果bi+bo的值过大，且wa值较大，则表示系统磁盘IO瓶颈

5.释放buffffer和cache

[root@linux_server ~]# echo 3 > /proc/sys/vm/drop_caches

6.带宽使用情况

[root@linux_server ~]# yum install -y epel*
[root@linux_server ~]# yum install -y iftop.x86_64
[root@linux_server ~]# iftop

image.png

第一行：界面上面显示的是类似刻度尺的刻度范围，为显示流量图形的长条作标尺用的。
中间部分：中间的<= =>这两个左右箭头，表示的是流量的方向。=>代表发送，<=代表接收。
TX：发送流量
RX：接收流量
TOTAL：总流量
Cumm：运行iftop到目前时间的总流量
peak：流量峰值
rates：分别表示过去 2s 10s 40s 的平均流量

7.动态查看进程

[root@linux_server ~]# yum -y install htop
[root@linux_server ~]# htop

image.png

各项从上至下分别说明如下：
左边部分从上至下，分别为，cpu、内存、交换分区的使用情况，右边部分为：Tasks为进程总数，当前运行的进程数、Load average为系统1分钟，5分钟，10分钟的平均负载情况、Uptime为系统运行的时间。
以上各项分别为：
PID：进行的标识号
USER：运行此进程的用户
PRI：进程的优先级
NI：进程的优先级别值，默认的为0，可以进行调整
VIRT：进程占用的虚拟内存值
RES：进程占用的物理内存值
SHR：进程占用的共享内存值
S：进程的运行状况，R表示正在运行、S表示休眠，等待唤醒、Z表示僵死状态
%CPU：该进程占用的CPU使用率
%MEM：该进程占用的物理内存和总内存的百分比
TIME+：该进程启动后占用的总的CPU时间
COMMAND：进程启动的启动命令名称

#Linux htop工具使用详解  -----了解
h, ?    F1  查看htop使用说明
S   F2  htop 设定
/   F3  搜索进程
\   F4  增量进程过滤器
t   F5  显示树形结构
<, >    F6  选择排序方式
[   F7  可减少nice值可以提高对应进程的优先级
]   F8  可增加nice值，降低对应进程的优先级
k   F9  可对进程传递信号
q   F10 结束htop
u   只显示一个给定的用户的过程
U   取消标记所有的进程
H   显示或隐藏用户线程
K   显示或隐藏内核线程
F   跟踪进程
P   按CPU 使用排序
M   按内存使用排序
T   按Time+ 使用排序
l   显示进程打开的文件
I   倒转排序顺序
s   选择某进程，按s:用strace追踪进程的系统调用

8.监控网速

[root@linux_server ~]# yum -y install nload
[root@linux_server ~]# nload

image.png

上半部分是：Incoming也就是进入网卡的流量
下半部分是：Outgoing，也就是从这块网卡出去的流量， 
每部分都有当前流量（Curr）， 
平均流量（Avg）， 
最小流量（Min）， 
最大流量（Max）， 
总和流量（Ttl）.

9.网络接口统计报告

[root@linux_server ~]# yum -y install nethogs
[root@linux_server ~]# nethogs

image.png

实例1：设置5秒钟刷新一次，通过-d来指定刷新频率 
# nethogs -d 5 
实例2：监视ens33网络带宽 
# nethogs ens33 
实例3：同时监视eth0和eth1接口 
# nethogs ens33 ens34

10.文件句柄

在linux/unix操作系统中一切皆文件，我们的设备是文件，文件是文件，文件夹也是文件。当我们用户每发起一次请求，就会产生一个文件句柄。文件句柄可以简单的理解为文件句柄就是一个索引。文件句柄就会随着请求量的增多,进程调用频繁增加，那么产生的文件句柄也就会越多。

系统默认对文件句柄是有限制的，不可能会让一个进程无限制的调用句柄。因为系统资源是有限的，所以我们需要限制每一个服务能够使用多大的文件句柄。操作系统默认使用的文件句柄是1024个句柄。

10-1.设置方式

系统全局性修改

[root@nginx_server ~]# vim /etc/security/limits.conf

#*               soft    core            0
#*               hard    rss             10000
#@student        hard    nproc           20
#@faculty        soft    nproc           20
#@faculty        hard    nproc           50
#ftp             hard    nproc           0
#@student        -       maxlogins       4

#root只是针对root这个用户来限制，soft只是发提醒，操作系统不会强制限制,一般的站点设置为一万左右就ok了
root soft nofile 65535
root hard nofile 65535
# *代表通配符 所有的用户
*    soft nofile 25535
*    hard nofile 25535  #hard硬控制，到达设定值后，操作系统会采取机制对当前进程进行限制，这个时候请求就会受到影响

可以看到root和*，root代表是root用户，*代表的是所有用户，后面的数字就是文件句柄大小。
大家可以根据个人业务来进行设置。

ulimit 命令
# -a 　显示目前资源限制的设定。
• -c <core文件上限> 　设定core文件的最大值，单位为区块。
• -d <数据节区大小> 　程序数据节区的最大值，单位为KB。
• -f <文件大小> 　shell所能建立的最大文件，单位为区块。
• -H 　设定资源的硬性限制，也就是管理员所设下的限制。
• -m <内存大小> 　指定可使用内存的上限，单位为KB。
# -n <文件数目> 　指定同一时间最多可开启的文件数。
• -p <缓冲区大小> 　指定管道缓冲区的大小，单位512字节。
• -s <堆叠大小> 　指定堆叠的上限，单位为KB。
• -S 　设定资源的弹性限制。
• -t <CPU时间> 　指定CPU使用时间的上限，单位为秒。
• -u <程序数目> 　用户最多可开启的程序数目。
• -v <虚拟内存大小> 　指定可使用的虚拟内存上限，单位为KB


1、ulimit -a       显示系统资源的设置
core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 63154
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 63154
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

2、ulimit -n 65535  #修改打开句柄数  ---临时

十五、系统调优

1、查看平均负载

2、查看CPU每隔10min的使用情况

3.查看进程io使用情况

4.查看内存使用情况

5.释放buffffer和cache

6.带宽使用情况

7.动态查看进程

8.监控网速

9.网络接口统计报告

10.文件句柄

猜你喜欢

热点阅读