recv出错errno=4[Interrupted system
当Socket编程使用while循环recv的时候出现如下错误(被信号中断):
这是由于在此线程中同时使用了信号,而慢系统调用(阻塞系统调用)在使线程休眠等待时被信号唤醒,当捕获到某个信号且相应信号处理函数返回时,这个系统调用被中断,调用返回错误,设置errno为EINTR(相应的错误描述为“Interruptedsystem call”)。
1.术语
慢系统调用适用于那些可能永远阻塞的系统调用。永远阻塞的系统调用是指调用永远无法返回,多数网络支持函数都属于这一类。如:若没有客户连接到服务器上,那么服务器的accept调用就会一直阻塞。
慢系统调用可以被永久阻塞,包括以下几个类别:
- 读写‘慢’设备(包括pipe,终端设备,网络连接等)。读时,数据不存在,需要等待;写时,缓冲区满或其他原因,需要等待。读写磁盘文件一般不会阻塞。
- 当打开某些特殊文件时,需要等待某些条件,才能打开。例如:打开中断设备时,需要等到连接设备的modem响应才能完成。
- pause和wait函数。pause函数使调用进程睡眠,直到捕获到一个信号。wait等待子进程终止。
- 某些ioctl操作。
- 某些IPC操作。
2.EINTR介绍
早期的Unix系统,如果进程在一个慢系统调用(slowsystem call)中阻塞时,当捕获到某个信号且相应信号处理函数返回时,这个系统调用被中断,调用返回错误,设置errno为EINTR(相应的错误描述为“Interruptedsystem call”)。
如下表所示的系统调用就会产生EINTR错误,当然不同的函数意义也不同。
系统调用函数 | errno为EINTR表征的意义 |
---|---|
write | 由于信号中断,没写成功任何数据。 |
open | 由于信号中断,没读到任何数据。 |
recv | 由于信号中断返回,没有任何数据可用。 |
sem_wait | 函数调用被信号处理函数中断。 |
3.解决类似问题有3种方法
-
人为重启被中断的系统调用
-
安装信号时设置 SA_RESTART属性(该方法对有的系统调用无效)
-
忽略信号(让系统不产生信号中断)
3.1.人为重启被中断的系统调用
人为当碰到EINTR错误的时候,有一些可以重启的系统调用要进行重启,而对于有一些系统调用是不能够重启的。例如:accept、read、write、select、和open之类的函数来说,是可以进行重启的。不过对于套接字编程中的connect函数我们是不能重启的,若connect函数返回一个EINTR错误的时候,我们不能再次调用它,否则将立即返回一个错误。针对connect不能重启的处理方法是,必须调用select来等待连接完成。
这里的“重启”怎么理解?
一些IO系统调用执行时,如 read等待输入期间,如果收到一个信号,系统将中断read,转而执行信号处理函数.当信号处理返回后,系统遇到了一个问题:是重新开始这个系统调用,还是让系统调用失败?早期UNIX系统的做法是,中断系统调用,并让系统调用失败,比如read返回 -1,同时设置 errno为EINTR中断了的系统调用是没有完成的调用,它的失败是临时性的,如果再次调用则可能成功,这并不是真正的失败,所以要对这种情况进行处理,典型的方式为:
while((r= read(fd, buf,len))<0&&errno == EINTR);/*do nothing*/
connect的问题,当connect遇到EINTR错误时,不能向上面那样重新进入循环处理,原因是,connect的请求已经发送向对方,正在等待对方回应,这是如果重新调用connect,而对方已经接受了上次的connect请求,这一次的connect就会被拒绝,因此,需要使用select或poll调用来检查socket的状态,如果socket的状态就绪,则connect已经成功,否则,视错误原因,做对应的处理。
#include poll.h
int check_conn_is_ok(socket_t sock) {
structpollfd fd;
intret = 0;
socklen_tlen = 0;
fd.fd= sock;
fd.events= POLLOUT;
while( poll (&fd, 1, -1) == -1 ) {
if(errno != EINTR ){
perror("poll");
return-1;
}
}
len= sizeof(ret);
if( getsockopt (sock, SOL_SOCKET, SO_ERROR,
&ret,
&len) == -1 ) {
perror("getsockopt");
return-1;
}
if(ret!= 0) {
fprintf(stderr, "socket %d connect failed: %s\n",
sock, strerror (ret));
return-1;
}
return0;
}
在调用connect时,这样使用:
#include erron.h
....
if(connnect()) {
if(errno == EINTR) {
if(check_conn_is_ok() < 0) {
perror();
return -1;
}
else {
printf("connect issuccess!\n");
}
}
else {
perror("connect");
return -1;
}
}
3.2.设置SA_RESTART属性
我们还可以从信号的角度来解决这个问题, 安装信号的时候, 设置 SA_RESTART属性,那么当信号处理函数返回后, 不会让系统调用返回失败,而是让被该信号中断的系统调用将自动恢复。
action.sa_handler = handler_func;
sigemptyset(&action.sa_mask);
action.sa_flags = 0;
/* 设置SA_RESTART属性 */
action.sa_flags |= SA_RESTART;
sigaction(SIGALRM, &action, NULL);
但注意,并不是所有的系统调用都可以自动恢复。如msgsnd和msgrcv就是典型的例子,我遇到的也是这种情况。msgsnd/msgrcv以block方式发送/接收消息时,会因为进程收到了信号而中断。此时msgsnd/msgrcv将返回-1,errno被设置为EINTR。且即使在插入信号时设置了SA_RESTART,也无效。在man msgrcv中就有提到这点:
msgsnd and msgrcv are never automatically restarted after being interrupted by a signal handler, regardless of the setting of the SA_RESTART flag when establishing a signal handler.
3.3.忽略信号
当然最简单的方法是忽略信号,在安装信号时,明确告诉系统不会产生该信号的中断。
struct sigaction action;
action.sa_handler = SIG_IGN;
sigemptyset(&action.sa_mask);
sigaction(SIGALRM, &action, NULL);
总结
处理方法有以下三种:①人为重启被中断的系统调用;②安装信号时设置 SA_RESTART属性;③忽略信号(让系统不产生信号中断)。
有时我们需要捕获信号,但又考虑到第②种方法的局限性(设置 SA_RESTART属性对有的系统无效,如msgrcv),所以在编写代码时,一定要“人为重启被中断的系统调用”。