Linux设计方案

十五、系统调优

2020-01-27  本文已影响0人  胖虎喜欢小红

简介:系统优化其本质是系统在提供服务的同时,承受压力过大需进行参数调优

1、查看平均负载

系统负载System Load:系统CPU繁忙程度的度量,即有多少进程在等待被CPU调度,平均负载(Load Average):一段时间内系统的平均负载,这个一段时间一般取1分钟、5分钟、15分钟

[root@linux_server ~]# uptime
10:48:38 up 5 min,  2 users,  load average: 0.05, 0.08, 0.05
1分钟平均负载,5分钟平均负载,15分钟平均负载分别是0.05,0.08,0.05
[root@linux_server ~]# w    #查看都有哪些用户连接服务器
 10:49:59 up 7 min,  2 users,  load average: 0.01, 0.06, 0.05
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root     tty1                      10:43    6:07   0.01s  0.01s -bash
root     pts/0    192.168.94.1     10:48    7.00s  0.02s  0.01s w

2、查看CPU每隔10min的使用情况

[root@linux_server ~]# yum -y install sysstat     #装完成之后需要等待一会
[root@linux_server ~]# sar 
Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)

08:50:01 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
09:00:01 PM     all      0.25      0.00      0.44      0.78      0.00     98.52
09:10:02 PM     all      0.55      0.00      0.32      0.16      0.00     98.98
Average:        all      0.40      0.00      0.38      0.47      0.00     98.75
-A:所有报告的总和
-u:输出CPU使用情况的统计信息
-v:输出inode、文件和其他内核表的统计信息
-d:输出每一个块设备的活动信息
-r:输出内存和交换空间的统计信息
-b:显示I/O和传送速率的统计信息
-a:文件读写情况
-c:输出进程统计信息,每秒创建的进程数
-R:输出内存页面的统计信息
-y:终端设备活动情况
-w:输出系统交换活动信息

例如,每2秒采样一次,连续采样3次,观察CPU 的使用情况
[root@linux_server ~]# sar -u 2 3
Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)

09:19:21 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
09:19:23 PM     all      0.00      0.00      0.50      0.00      0.00     99.50
09:19:25 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
09:19:27 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
Average:        all      0.00      0.00      0.17      0.00      0.00     99.83
参数详解:
CPU:all 表示统计信息为所有 CPU 的平均值。
%user:显示在用户级别(application)运行使用 CPU 总时间的百分比。
%nice:显示在用户级别,用于nice操作,所占用 CPU 总时间的百分比。
%system:在核心级别(kernel)运行所使用 CPU 总时间的百分比。
%iowait:显示用于等待I/O操作占用 CPU 总时间的百分比。
%steal:管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟 CPU 的百分比。
%idle:显示 CPU 空闲时间占用 CPU 总时间的百分比。
1. 若 %iowait 的值过高,表示硬盘存在I/O瓶颈。
2. 若 %idle 的值高但系统响应慢时,有可能是 CPU 等待分配内存,此时应加大内存容量。
3. 若 %idle 的值持续低于1,则系统的 CPU 处理能力相对较低,表明系统中最需要解决的资源是 CPU。
===================================================================================
例如,每3秒采样一次,连续采样3次,观察内存和交换空间状态
[root@linux_server ~]# sar -r 3 3
Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)

09:20:55 PM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
09:20:58 PM    676148    323548     32.36         0    169548    293372      9.47    136672     91728         0
09:21:01 PM    676148    323548     32.36         0    169548    293372      9.47    136672     91728         0
09:21:04 PM    676148    323548     32.36         0    169548    293372      9.47    136676     91728         0
Average:       676148    323548     32.36         0    169548    293372      9.47    136673     91728         0
参数详解:
输出项说明:
kbmemfree:这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.
kbmemused:这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间.
%memused:这个值是kbmemused和内存总量(不包括swap)的一个百分比.
kbbuffers和kbcached:这两个值就是free命令中的buffer和cache
kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
%commit:这个值是kbcommit与内存总量(包括swap)的一个百分比.
=============================================================================

3.查看进程io使用情况

[root@linux_server ~]# yum -y install iotop
[root@linux_server ~]# iotop
[root@linux_server ~]# iotop -b -n 3 -d 5
--version #显示版本号 
-h, --help #显示帮助信息 
-o, --only #显示进程或者线程实际上正在做的I/O,而不是全部的,可以随时切换按o 
-b, --batch #运行在非交互式的模式 
-n NUM, --iter=NUM #在非交互式模式下,设置显示的次数, 
-d SEC, --delay=SEC #设置显示的间隔秒数,支持非整数值 
-p PID, --pid=PID #只显示指定PID的信息 
-u USER, --user=USER #显示指定的用户的进程的信息 
-P, --processes #只显示进程,一般为显示所有的线程 
-a, --accumulated #显示从iotop启动后每个线程完成了的IO总数 
-k, --kilobytes #以千字节显示 
-t, --time #在每一行前添加一个当前的时间
IO #IO利用率

4.查看内存使用情况

[root@linux_server ~]# vmstat
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 2  0      0 648128   2108 251128    0    0   334    30  122  186  0  1 99  0  0

r: 表示运行和等待CPU时间片的进程数(就是说多少个进程真的分配到CPU),这个值如果长期大于系统CPU个数,说明CPU 不足,需要增加CPU  
b:表示在等待资源的进程数。 
 
2、memory 
swpd:表示切换到内存交换区的内存大小,即虚拟内存已使用的大小(单位KB),如果大于0,表示你的机器物理内存不足 了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。 
free:表示当前空闲的物理内存 
buff:表示baffers cached内存大小,也就是缓冲大小,一般对块设备的读写才需要缓冲 
Cache:表示page cached的内存大小,也就是缓存大小,一般作为文件系统进行缓冲,频繁访问的文件都会被缓存,如果 cache值非常大说明缓存文件比较多,如果此时io中的bi比较小,说明文件系统效率比较好 
 
3、swap 
si:表示有磁盘调入内存,也就是内存进入内存交换区的内存大小;通俗的讲就是 每秒从磁盘读入虚拟内存的大小,如果这 个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。
so:表示由内存进入磁盘,也就是由内存交换区进入内存的内存大小。 注意:一般情况下si、so的值都为0,如果si、so的值长期不为0,则说明系统内存不足,需要增加系统内存 
 
4、io 
bi:表示由块设备读入数据的总量,即读磁盘,单位kb/s 
bo:表示写到块设备数据的总量,即写磁盘,单位kb/s 
注意:如果bi+bo的值过大,且wa值较大,则表示系统磁盘IO瓶颈

5.释放buffffer和cache

[root@linux_server ~]# echo 3 > /proc/sys/vm/drop_caches

6.带宽使用情况

[root@linux_server ~]# yum install -y epel*
[root@linux_server ~]# yum install -y iftop.x86_64
[root@linux_server ~]# iftop
image.png
第一行:界面上面显示的是类似刻度尺的刻度范围,为显示流量图形的长条作标尺用的。
中间部分:中间的<= =>这两个左右箭头,表示的是流量的方向。=>代表发送,<=代表接收。
TX:发送流量
RX:接收流量
TOTAL:总流量
Cumm:运行iftop到目前时间的总流量
peak:流量峰值
rates:分别表示过去 2s 10s 40s 的平均流量

7.动态查看进程

[root@linux_server ~]# yum -y install htop
[root@linux_server ~]# htop
image.png
各项从上至下分别说明如下:
左边部分从上至下,分别为,cpu、内存、交换分区的使用情况,右边部分为:Tasks为进程总数,当前运行的进程数、Load average为系统1分钟,5分钟,10分钟的平均负载情况、Uptime为系统运行的时间。
以上各项分别为:
PID:进行的标识号
USER:运行此进程的用户
PRI:进程的优先级
NI:进程的优先级别值,默认的为0,可以进行调整
VIRT:进程占用的虚拟内存值
RES:进程占用的物理内存值
SHR:进程占用的共享内存值
S:进程的运行状况,R表示正在运行、S表示休眠,等待唤醒、Z表示僵死状态
%CPU:该进程占用的CPU使用率
%MEM:该进程占用的物理内存和总内存的百分比
TIME+:该进程启动后占用的总的CPU时间
COMMAND:进程启动的启动命令名称

#Linux htop工具使用详解  -----了解
h, ?    F1  查看htop使用说明
S   F2  htop 设定
/   F3  搜索进程
\   F4  增量进程过滤器
t   F5  显示树形结构
<, >    F6  选择排序方式
[   F7  可减少nice值可以提高对应进程的优先级
]   F8  可增加nice值,降低对应进程的优先级
k   F9  可对进程传递信号
q   F10 结束htop
u   只显示一个给定的用户的过程
U   取消标记所有的进程
H   显示或隐藏用户线程
K   显示或隐藏内核线程
F   跟踪进程
P   按CPU 使用排序
M   按内存使用排序
T   按Time+ 使用排序
l   显示进程打开的文件
I   倒转排序顺序
s   选择某进程,按s:用strace追踪进程的系统调用

8.监控网速

[root@linux_server ~]# yum -y install nload
[root@linux_server ~]# nload
image.png
上半部分是:Incoming也就是进入网卡的流量
下半部分是:Outgoing,也就是从这块网卡出去的流量, 
每部分都有当前流量(Curr), 
平均流量(Avg), 
最小流量(Min), 
最大流量(Max), 
总和流量(Ttl).

9.网络接口统计报告

[root@linux_server ~]# yum -y install nethogs
[root@linux_server ~]# nethogs
image.png
实例1:设置5秒钟刷新一次,通过-d来指定刷新频率 
# nethogs -d 5 
实例2:监视ens33网络带宽 
# nethogs ens33 
实例3:同时监视eth0和eth1接口 
# nethogs ens33 ens34

10.文件句柄

在linux/unix操作系统中一切皆文件,我们的设备是文件,文件是文件,文件夹也是文件。当我们用户每发起一次请求,就会产生一个文件句柄。文件句柄可以简单的理解为文件句柄就是一个索引。文件句柄就会随着请求量的增多,进程调用频繁增加,那么产生的文件句柄也就会越多。

系统默认对文件句柄是有限制的,不可能会让一个进程无限制的调用句柄。因为系统资源是有限的,所以我们需要限制每一个服务能够使用多大的文件句柄。操作系统默认使用的文件句柄是1024个句柄。

10-1.设置方式

[root@nginx_server ~]# vim /etc/security/limits.conf 
#*               soft    core            0
#*               hard    rss             10000
#@student        hard    nproc           20
#@faculty        soft    nproc           20
#@faculty        hard    nproc           50
#ftp             hard    nproc           0
#@student        -       maxlogins       4

#root只是针对root这个用户来限制,soft只是发提醒,操作系统不会强制限制,一般的站点设置为一万左右就ok了
root soft nofile 65535
root hard nofile 65535
# *代表通配符 所有的用户
*    soft nofile 25535
*    hard nofile 25535  #hard硬控制,到达设定值后,操作系统会采取机制对当前进程进行限制,这个时候请求就会受到影响

可以看到root*,root代表是root用户,*代表的是所有用户,后面的数字就是文件句柄大小。
大家可以根据个人业务来进行设置。

ulimit 命令
# -a  显示目前资源限制的设定。
• -c <core文件上限>  设定core文件的最大值,单位为区块。
• -d <数据节区大小>  程序数据节区的最大值,单位为KB。
• -f <文件大小>  shell所能建立的最大文件,单位为区块。
• -H  设定资源的硬性限制,也就是管理员所设下的限制。
• -m <内存大小>  指定可使用内存的上限,单位为KB。
# -n <文件数目>  指定同一时间最多可开启的文件数。
• -p <缓冲区大小>  指定管道缓冲区的大小,单位512字节。
• -s <堆叠大小>  指定堆叠的上限,单位为KB。
• -S  设定资源的弹性限制。
• -t <CPU时间>  指定CPU使用时间的上限,单位为秒。
• -u <程序数目>  用户最多可开启的程序数目。
• -v <虚拟内存大小>  指定可使用的虚拟内存上限,单位为KB


1、ulimit -a       显示系统资源的设置
core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 63154
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 63154
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

2、ulimit -n 65535  #修改打开句柄数  ---临时
上一篇下一篇

猜你喜欢

热点阅读