TCP
ode提供了net、dgram、http、https这4个模块,分别处理TCP、UDP、HTTP、HTTPS,适用于服务器端和客户端
TCP全名为传输控制协议,在OSI模型(由七层组成,分别为物理层、数据链结层、网络层、传输层、会话层、表示层、应用层)中属于传输层协议,许多应用层协议基于TCP构建,典型的是HTTP、SMTP、IMAP等协议。
{{% notice info %}}
以下内容大部分转载:
TCP的三次握手与四次挥手理解及面试题
参考:
TCP的三次握手与四次挥手(详解+动图)、
TCP-TCP首部、
TCP头部分析与确认号的理解
{{% /notice %}}
TCP把连接作为最基本的对象,每一条TCP连接都有两个端点,这种端点我们叫作套接字(socket),它的定义为端口号拼接到IP地址即构成了套接字,例如,若IP地址为192.0.0.16 而端口号为80,那么得到的套接字为192.0.0.16:80。
TCP连接 = {socket1, socket2} = {(IP1: port1), (IP2: port2)}
TCP首部
tcp.pngTCP首部有20个字节的固定数据,用来存放报文传输过程所需的信息。
1、源端口和目的端口各占2个字节
2、序列号seq:占4个字节,用来标记数据段的顺序,TCP把连接中发送的所有数据字节都编上一个序号,第一个字节的编号就是序列号,由本地随机产生。例如,一段报文的序列号字段值是 301 ,而携带的数据共有100字节,显然下一个报文段(如果还有的话)的数据序号应该从401开始;由于序列号占4个字节,32位,所以能表达的数字范围为[0, 2^32-1 ] (无符号位),4294967296个序号,序号增加到最大值的时候,下一个序号又回到了 0.也就是说 TCP 协议可对 约4GB 的数据进行编号,在一般情况下可保证当序号重复使用时,旧序号的数据早已经通过网络到达终点或者丢失了。
3、确认号ack:占4个字节,是期望收到对方下一个报文的第一个数据字节的序号。例如,B收到了A发送过来的报文,其序列号字段是301,而数据长度是100字节,这表明B正确的收到了A发送的到序号400为止的数据。因此,B期望收到A的下一个数据序号是401,于是B在发送给A的确认报文段中把确认号置为401。TCP 的可靠性,是建立在「每一个数据报文都需要确认收到」的基础之上的。就是说,通讯的任何一方在收到对方的一个报文之后,都要发送一个相对应的「确认报文」,来表达确认收到。
4、数据偏移:占4位,以4字节为单位,表示报文中除开有效数据段,代表报文首部的长度,4位所能表达的二进制为0000-1111,代表数字0~15,每一位代表4个字节,又因为TCP首部固定有20个字节的,所以数据偏移的范围为0101 (5 * 4b = 20b) - 1111 (15 * 4b = 60b),所以报文首部长度的范围为20字节~60字节。
5、保留位:占6位,目前置为0,为今后预留
6、控制位,占6位,共代表6种状态。当为1时表明状态有效。
- URG:紧急,当URG=1,表明紧急指针字段有效。告诉系统此报文段中有紧急数据;TCP就将紧急数据放到数据区的最前面,紧跟其后是普通数据。
- ACK:确认,当ACK=1时,代表确认号ack字段有效。ACK=0时,确认号无效,TCP规定,在连接建立后所有报文的传输都必须把ACK置1
- PSH:推送,当PSH=1时,发送方会立即创建一个报文段发送出去;接收方接收到PSH字段为1的值时,会立即将该报文中的数据交付接收应用程序,不用等到整个缓存填满了后再向上交付
- RST:复位,当RST=1,表明TCP连接中出现严重差错,必须释放连接,然后再重新建立连接;
- SYN:连接建立时用于同步序号。当SYN=1,ACK=0时表示:这是一个连接请求报文段。若同意连接,则在响应报文段中使得SYN=1,ACK=1。因此,SYN=1表示这是一个连接请求,或连接接受报文。SYN这个标志位只有在TCP建立连接时才会被置1,握手完成后SYN标志位被置0。
- FIN:终止,当FIN=1,表明此报文的发送方的数据已经发送完毕,并且要求释放;
7、窗口:占2个字节,指的是通知接收方,发送本报文你需要有多大的空间来接受;也就是TCP的标准窗口最大为2^16 - 1 = 65535个字节
8、检验和,占2字节,校验首部和数据这两部分;源机器基于数据内容计算一个数值,收信息机要与源机器数值 结果完全一样,从而证明数据的有效性。检验和覆盖了整个的TCP报文段:这是一个强制性的字段,一定是由发送端计算和存储,并由接收端进行验证的。
9、紧急指针,占2字节,在URG=1时,表示紧急数据的长度,指出了紧急数据的末尾在报文段的位置。
10、选项与填充(必须为4字节整数倍,不够补0),长度可变,不包含在固定首部之中,定义一些其他的可选的参数,最常见的可选字段的最长报文大小MSS(Maximum Segment Size),每个连接方通常都在一个报文段中指明这个选项。它指明本端所能接收的最大长度的报文段。该选项如果不设置,默认为536(20+20+536=576字节的IP数据报)
三次握手:建立连接
connect.png最开始的时候客户端和服务器都是处于CLOSED状态。主动打开连接的为客户端,被动打开连接的是服务器。
第一次握手:建立连接时,客户端发送SYN包(此时控制位SYN为1,代表连接请求,seq=x,序列号)到服务器,并进入SYN_SENT状态,等待服务器确认;TCP规定,SYN报文段(SYN=1的报文段)不能携带数据,但需要消耗掉一个序号,因此第二次握手中ack确认号为x+1。
第二次握手:服务器收到SYN包,如果同意连接,则发出确认报文。确认报文中应该 ACK=1,SYN=1,确认号是ack=x+1,同时也要为自己初始化一个序列号 seq=y,即SYN+ACK包,此时服务器进入SYN_RECV状态;这个报文也不能携带数据,但是同样要消耗一个序号。
第三次握手:客户端收到服务器的SYN+ACK包,还要向服务器给出确认。确认报文的ACK=1,ack=y+1,自己的序列号seq=x+1,此包发送完毕,客户端和服务器进入ESTABLISHED(TCP连接成功)状态,完成三次握手。TCP规定,ACK报文段可以携带数据,但是如果不携带数据则不消耗序号。
四次挥手:关闭连接
close.png1)客户端进程发出连接释放报文,并且停止发送数据。释放数据报文首部,FIN=1,其序列号为seq=u,此时,客户端进入FIN-WAIT-1(终止等待1)状态。 TCP规定,FIN报文段即使不携带数据,也要消耗一个序号。
2)服务器收到连接释放报文,发出确认报文,ACK=1,ack=u+1,并且带上自己的序列号seq=v,此时,服务端就进入了CLOSE-WAIT(关闭等待)状态。TCP服务器通知高层的应用进程,客户端向服务器的方向就释放了,这时候处于半关闭状态,即客户端已经没有数据要发送了,但是服务器若发送数据,客户端依然要接受。这个状态还要持续一段时间,也就是整个CLOSE-WAIT状态持续的时间。
3)客户端收到服务器的确认请求后,此时,客户端就进入FIN-WAIT-2(终止等待2)状态,等待服务器发送连接释放报文(在这之前还需要接受服务器发送的最后的数据)。
4)服务器将最后的数据发送完毕后,就向客户端发送连接释放报文,FIN=1,ack=u+1,由于在半关闭状态,服务器很可能又发送了一些数据,假定此时的序列号为seq=w,此时,服务器就进入了LAST-ACK(最后确认)状态,等待客户端的确认。
5)客户端收到服务器的连接释放报文后,必须发出确认,ACK=1,ack=w+1,而自己的序列号是seq=u+1,此时,客户端就进入了TIME-WAIT(时间等待)状态。注意此时TCP连接还没有释放,必须经过2MSL(最长报文段寿命)的时间后,当客户端撤销相应的TCB后,才进入CLOSED状态。
6)服务器只要收到了客户端发出的确认,立即进入CLOSED状态。同样,撤销TCB后,就结束了这次的TCP连接。可以看到,服务器结束TCP连接的时间要比客户端早一些。
常见面试题
【问题1】为什么连接的时候是三次握手,关闭的时候却是四次握手?
答:因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,"你发的FIN报文我收到了"。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。
【问题2】为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态?
答:虽然按道理,四个报文都发送完毕,我们可以直接进入CLOSE状态了,但是我们必须假象网络是不可靠的,有可能最后一个ACK丢失。所以TIME_WAIT状态就是用来重发可能丢失的ACK报文。在Client发送出最后的ACK回复,但该ACK可能丢失。Server如果没有收到ACK,将不断重复发送FIN片段。所以Client不能立即关闭,它必须确认Server接收到了该ACK。Client会在发送出ACK之后进入到TIME_WAIT状态。Client会设置一个计时器,等待2MSL的时间。如果在该时间内再次收到FIN,那么Client会重发ACK并再次等待2MSL。所谓的2MSL是两倍的MSL(Maximum Segment Lifetime)。MSL指一个片段在网络中最大的存活时间,2MSL就是一个发送和一个回复所需的最大时间。如果直到2MSL,Client都没有再次收到FIN,那么Client推断ACK已经被成功接收,则结束TCP连接。
【问题3】为什么不能用两次握手进行连接?
答:3次握手完成两个重要的功能,既要双方做好发送数据的准备工作(双方都知道彼此已准备好),也要允许双方就初始序列号进行协商,这个序列号在握手过程中被发送和确认。
如果两次握手, 此时Client知道Server收到消息了, 但Server并不知道Client能收到消息
“已失效的连接请求报文段”的产生在这样一种情况下:Client发出的第一个连接请求报文段并没有丢失,而是在某个网络结点长时间的滞留了,以致延误到连接释放以后的某个时间才到达Server。本来这是一个早已失效的报文段。但Server收到此失效的连接请求报文段后,就误认为是Client再次发出的一个新的连接请求。于是就向Client发出确认报文段,同意建立连接。假设不采用“三次握手”,那么只要Server发出确认,新的连接就建立了。由于现在Client并没有发出建立连接的请求,因此不会理睬Server的确认,也不会向Server发送ack包。但Server却以为新的运输连接已经建立,并一直等待Client发来数据。这样,Server的很多资源就白白浪费掉了。采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况,Client不会向Server的确认发出确认。Server由于收不到确认,就知道Client并没有要求建立连接。
【问题4】如果已经建立了连接,但是客户端突然出现故障了怎么办?
TCP还设有一个保活计时器,显然,客户端如果出现故障,服务器不能一直等下去,白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器,时间通常是设置为2小时,若两小时还没有收到客户端的任何数据,服务器就会发送一个探测报文段,以后每隔75秒钟发送一次。若一连发送10个探测报文仍然没反应,服务器就认为客户端出了故障,接着就关闭连接。