用PHP玩转进程之一 — 基础

2018-11-16  本文已影响0人  Howborn

首发于 樊浩柏科学院

我们工作中接触最多的就是 进程,但是我们对它又比较陌生,因为它是业务不需要关心的地方,既有的公有组件和操作系统已经对我们屏蔽了它的复杂性。然后跟它的接触时间一长,我们难免会对它产生好奇:How it works?

预览图

什么是进程

进程是 程序的实体,是系统进行 资源分配和调度的基本单位,是操作系统结构的基础。每个进程都有自己唯一标识(PID),每个进程都有父进程,这些父进程也有父进程,所有进程都是init进程(PID 为 1)的子进程。

我们来直观感受下它的存在,可以说它是看不见又摸不着。

$ pstree -p
init(1)-+-init(3)---bash(4)
        |-nginx(771)-+-nginx(773)
        |            |-nginx(774)
        |            |-nginx(776)
        |            `-nginx(777)
        |-php-fpm(702)-+-php-fpm(707)
                       `-php-fpm(712)

进程分类

前台进程

前台进程具有控制终端,会堵塞控制终端。它的特点是:

$ php server.php start
PHPServer start   [OK] 

# 堵塞了/_ \

通常,在控制终端使用Ctrl+C组合键,会导致前台进程终止退出。

守护进程

守护进程是一种运行在后台的特殊进程,因为它不属于任何一个终端,所以不会收到任何终端发来的任何信号。它与前台进程显著的区别是:

通常我们编写的程序,都需要在 后台不终止的长期运行 ,此时就可以使用守护进程。当然,我们可以在代码中调用系统函数,或者直接在启动命令后追加&操作符,如下:

$ nohup php server.php start &
# &使进程脱离控制终端运行

通常&与 nohup 结合使用,忽略 SIGHUP 信号来实现一个守护进程。该方式对业务代码侵入最小,方便且成本低,常用于临时执行任务脚本的场景。

进程间通信(InterProcess Communication)

进程的用户空间是相互独立的,一般而言是不能相互访问。但很多情况下,进程间需要互相通信来进行数据传输、共享数据、通知事件、进程控制等,这就必须通过内核实现进程间通信。

进程间通信模型

进程间通信有管道、消息队列、信号、共享内存、套接字等方式,本文只介绍后 3 种。

共享内存(Shared Memory)

共享内存是一段被映射到多个进程地址空间的内存,虽然这段共享内存是由一个进程创建,但是多个进程都可以访问。如下图:

共享内存模型

共享内存是最快的进程间通信方式,但是可能会存在竞争,因此需要加锁。Linux 支持三种共享内存:mmap、Posix、以及 System V。

套接字(Socket)

套接字是一个通信链的句柄,可以用域、端口号、协议类型来表示一个套接字,其中域分为 Internet 网络(IP 地址)和 UNIX 文件(Sock 文件)两种。当域为 Internet 网络时,通信流程如下图:

套接字模型

特别的是,当套接字域为 Internet 网络时,可以实现 跨主机的进程间通信。因此,若要实现跨主机进行进程间通信,则须选用套接字。

信号(Signal)

信号受事件驱动,是一种异步且最复杂的通信方式,用于通知接受进程有某个事件已经发生,因此常用于事件处理。信号的处理机制,如下图:

信号模型

常用的信号值

在 Linux 系统中,可使用kill -l命令查看这 62 个信号值。其中常用值如下:

信号名称 说明 进程默认行为
SIGHUP 1 终端控制进程结束 Terminate
SIGINT 2 键盘Ctrl+C被按下 Terminate
SIGQUIT 3 键盘Ctrl+/被按下 Dump
SIGKILL 9 无条件结束进程 Terminate
SIGUSR1 10 用户保留 Terminate
SIGUSR2 12 用户保留 Terminate
SIGALRM 14 时钟定时信号 Terminate
SIGTERM 15 程序结束 Terminate
SIGCHLD 16 子进程结束 Ignore

产生信号的方式

实际中,硬件或者软件中断都会触发信号,但这里只列举两种信号产生方式。

按键/命令 信号名称
Ctrl+C SIGINT
Ctrl+\ SIGQUIT
EXIT SIGHUP

通过kill系统调用发送信号。例如,在 Shell 中使用kill -9发送 SIGKILL 信号。对于kill调用,需要注意以下两种特殊情况:

1、 特殊信号

可以发送编号为0的信号来 检测进程是否存活

$pid = 577;
if (posix_kill($pid, 0)) {
    echo "进程存在\n";
} else {
    echo "进程不存在\n";
}

2、 特殊 PID

这里的参数$pid,根据取值范围不同,含义也不同。具体如下:

进程的处理方式

进程共有 3 种处理信号的方式:

其中,默认行为进一步可以细分为以下几种:

默认处理类型 描述
Terminate 进程被中止(杀死)
Dump 进程被中止(杀死),并且输出 dump 文件
Ignore 信号被忽略
Stop 进程被停止

信号的默认行为类型,见 常用的信号值 默认行为部分。

进程间关系

使用ps -ajx命令查看所有进程信息,如下:

#父PID  PID  组ID 会话ID 终端      时间   名称
PPID   PID  PGID   SID TTY      TIME COMMAND
    0     1     1     1 ?       0:00 /init ro
    1    43    43    43 ?       0:00 /usr/sbin/sshd
   43 11134 11134 11134 ?       0:00 sshd: root@pts/1
11134 11169 11169 11169 pts/1   0:00 -bash
11169 11251 11251 11169 pts/1   0:00 PHPServer: master   
11251 11252 11251 11169 pts/1   0:36 PHPServer: worker   
11251 11253 11251 11169 pts/1   0:42 PHPServer: worker   

进程组(Process Group)

进程组是一个或多个进程的集合。每个进程除了有一个 PID 之外还有一个进程组 ID(GID),每个进程都属于一个进程组,每个进程都有一个组长进程。

如上图中,1 个PHPServer: master主进程和 2 个PHPServer: worker子进程,属于同一个进程组11251,可以看出主进程是组长进程。

会话(Session)

会话是一个或多个进程组的集合,一个会话有对应的控制终端。如上图中,4 个PHPServer进程和-bash进程同属于一个会话,因为他们在一个pts/1的控制终端。

需要说明的是,当用户退出(Logout)会话以后,系统默认对该会话下的进程进行如下操作:

  1. 系统向该会话发出 SIGHUP 信号;
  2. 该会话将 SIGHUP 信号发给所有子进程;
  3. 子进程收到 SIGHUP 信号后,自动退出;

而对于后台进程,用户在退出时系统默认不会发送 SIGHUP 信号,这是由 Shell 的huponexit参数(默认off)控制。可通过shopt -s huponexit设置成on(当前会话有效),此时后台进程会收到 SIGHUP 信号。

进程模型

从进程层面来说,程序可以分为单进程和多进程模型。

单进程模型的程序,只有一个进程在运行。他是最基本的进程模型,实现起来比较简单,Redis 就是采用这种进程模型。

信号模型

为了提高程序的并发处理能力,程序由单进程慢慢演变成了多进程,一 个 Master 进程和多个 Worker 进程是多进程常见的构成形态。可以说,现在大部分程序都是多进程模型,其中 Nginx 是典型的代表。

总结

到这里,我们已经对进程有了基础的认识,后续我将用 PHP 一步步实现一个 PHPServer 应用。

相关文章 »

上一篇 下一篇

猜你喜欢

热点阅读