Linux下多进程编程API
进程是Linux操作系统环境的基础,它控制着系统几乎所有的活动,下面介绍Linux下多进程的系统调用API。
fork()系统调用
Linux下创建新进程的系统调用时fork(),定义如下:
#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);
该函数每的每次调用都返回两次,在父进程中返回的是子进程的PID, 在子进程中返回0 。返回值是后续用来判断当前进程为父进程还是子进程的依据。fork调用失败返回-1,并设置errno。
fork()函数复制当前进程,在内核进程表中创建一个新的进程表项。新的进程表项有许多属性和原进程相同。比如,堆指针,栈指针,标志寄存器的值。但也有许多属性被赋予了新的值,比如。PPID,信号位图被清除,原来进程设置的信号处理函数不在对新进程起作用。
子进程的代码和父进程的代码完全相同,同时他还会复制父进程的数据(堆数据,栈数据和静态数据)。但是数据的复制采用的是写时复制(copy on write)。即只有在任一进程对数据执行了写操作的时候,复制才会发生(先是发生缺页中断,然后操作系统给子进程分配内存并复制父进程的数据)。即便如此,我们在程序中分配了大量内存的时候,也要谨慎使用fork(),避免复制没有必要的内存和数据。
此外,父进程中打开了文件描述符,fork()后,子进程也是打开的,且文件描述符的引用计数加1。不仅如此,父进程的用户根目录,当前工作目录等变量的引用计数都会加1。
exec系列系统调用
有时我们需要在子进程中执行其他程序,即在fork()后替换当前进程的映像,需要使用到一下的函数:
extern char** environ;
// 替换当前进程映像
// path 参数指定可执行文件的全路径,
// arg 接受可变参数
int execl(const char* path, const char* arg, ...);
// file 参数可以接受文件名,该文件的具体位置则在环境变量PATH中搜索,
int execlp(const char* file, const char* arg, ...);
// argp 用于设置环境变量
int execle(const char* path, const char* arg, ..., char* const envp[]);
// argv 表示可以接受参数数组,他们都会被传递给新进程
int execv(const char* path, char* const argv[]);
int execvp(const char* file, char* argv[]);
int execve(const char* path, char* const argv[], char* const envp[]);
一般情况下,exec函数是不返回的,除非出错,出错时返回 -1,并设置errno。
如果exec执行成果,exec下面的代码不会执行的,类似于return 语句。
exec 函数不会关闭源程序打开的文件描述符,除非该文件描述符被设置了类似于SOCK_CLOEXEC的属性。
wait处理僵尸进程
在多进程的编程中,父进程一般会跟踪子进程的退出状态。因此,当子进程结束运行时,内核不会立即释放该进程的进程表表项,以满足父进程后续对子进程进程退出信息的查询。
在子进程退出,父进程没有获取其退出状态之前,我们任务他是僵尸进程。
在僵尸态的进程,它依然占据着内核资源。这时绝对不允许的,毕竟内核资源有限。
#include <sys/types.h>
#include <sys/wait.h>
// 返回子进程的pid, stat_loc获取退出状态 ,阻塞等待。
pid_t wait(int* stat_loc);
// pid == -1时,获取任意个子进程,非阻塞的。
pid_t waitpid(pid_t pid, int* stat_loc, int option);
wait函数阻塞进程,直到该进程的某个子进程运行结束为止。
waitpid函数只等待pid参数指定的子进程。如果pid取值为-1,那么和wait函数相同。waitpid是非阻塞的,如果pid指定的目标子进程还没有结束,或者意外终止,waitpid 返回0,如果子进程确实正确退出了,waitpid返回子进程的PID。waitpid调用失败返回-1,并设置errno。
static void handle_chile(int signal) {
pid_t pid;
int stat ;
while ( (pid = waitpid(-1, &stat, WNOHANG)) > 0) {
// 对子进程进行善后处理
}
}