TCP的可靠性
说起TCP协议,可能这句话很多人都听过,那就是TCP的定义:
TCP(Transmission Control Protocol 传输控制协议)是一种面向连接(连接导向)的、可靠的、 基于IP的传输层协议。
面向连接这个很好理解,TCP协议要求数据传输之前建立连接,数据传输完成后将连接拆除。TCP是基于IP的的传输层协议,这个也没什么好说的,看一下TCP IP网络模型就能明白。今天主要谈论的就是TCP的可靠性,也就是咱们为什么将TCP看成一个可靠的传输层协议,它的可靠性又从何而来。
首先咱们看一下TCP的报头有哪些字段,其含义是什么。
TCP报头格式.jpeg
16位端口号(port number):告知主机该报文段是来自哪里(源端口)以及传给哪个上层协议或应用程序(目的端口)的。进行TCP通信时,客户端通常使用系统自动选择的临时端口号,而服务器则使用知名服务端口号。
32位序号(sequence number):一次TCP通信(从TCP连接建立到断开)过程中某一个传输方向上的字节流的每个字节的编号。假设主机A和主机B进行TCP通信,A发送给B的第一个TCP报文段中,序号值被系统初始化为某个随机值ISN(Initial Sequence Number,初始序号值)。那么在该传输方向上(从A到B),后续的TCP报文段中序号值将被系统设置成ISN加上该报文段所携带数据的第一个字节在整个字节流中的偏移。
32位确认号(acknowledgement number):用作对另一方发送来的TCP报文段的响应。其值是收到的TCP报文段的序号值加1。假设主机A和主机B进行TCP通信,那么A发送出的TCP报文段不仅携带自己的序号,而且包含对B发送来的TCP报文段的确认号。反之,B发送出的TCP报文段也同时携带自己的序号和对A发送来的报文段的确认号。
4位头部长度(header length):标识该TCP头部有多少个32bit字(4字节)。因为4位最大能表示15,所以TCP头部最长是60字节。
6位标志位包含如下几项:
URG标志,表示紧急指针(urgent pointer)是否有效。
ACK标志,表示确认号是否有效。我们称携带ACK标志的TCP报文段为确认报文段。
PSH标志,提示接收端应用程序应该立即从TCP接收缓冲区中读走数据,为接收后续数据腾出空间。
RST标志,表示要求对方重新建立连接。我们称携带RST标志的TCP报文段为复位报文段。
SYN标志,表示请求建立一个连接。我们称携带SYN标志的TCP报文段为同步报文段。
FIN标志,表示通知对方本端要关闭连接了。我们称携带FIN标志的TCP报文段为结束报文段。
16位窗口大小(window size):是TCP流量控制的一个手段。这里说的窗口,指的是接收通告窗口(Receiver Window,RWND)。它告诉对方本端的TCP接收缓冲区还能容纳多少字节的数据,这样对方就可以控制发送数据的速度。
16位校验和(TCP checksum):由发送端填充,接收端对TCP报文段执行CRC算法以检验TCP报文段在传输过程中是否损坏。注意,这个校验不仅包括TCP头部,也包括数据部分。这也是TCP可靠传输的一个重要保障。
16位紧急指针(urgent pointer):是一个正的偏移量。它和序号字段的值相加表示最后一个紧急数据的下一字节的序号。TCP的紧急指针是发送端向接收端发送紧急数据的方法
在TCP报头中,与可靠性相关的字段有很多,所以当一个应用程序把数据流交付给TCP后,TCP有天然的优势保证将这些数据以按序的、没有差错的、也没有任何一部分丢失或重复的状态交付另外一端的应用程序。
如何做到的?
-
每个TCP报文段都有一个校验和字段。TCP规定每个报文段都必须使用16位的校验和,且如果某个报文段因校验和无效而被检查出受到损伤,就由终点TCP将其丢失,并被认为是丢失了。
-
每个TCP报文段都有一个确认号字段,用来实现对收到的报文段进行确认,并宣称下次期望接收的下一个字节的序号是什么。只有当A端收到来自B端的确认报文段后,A端才会认定之前发送的数据安全到达,并发送下一段数据(某些情况下不是这样)。相当于对快递的签收吧。
-
发送方TCP会为每一条连接设置一个重传超时计时器(RTO)。在一个报文段发送是,它会被保存到一个队列中,知道被确认为止。当重传计时器超时,或者发送方收到该队列中第一个报文段的三个重复ACK时(快重传机制),该报文段被重传。TCP中重传计时器的值是动态的,它根据报文段的往返时间(RTT)更新,一个RTT是一个报文段到底终点并受到它的确认所需的时间。
通过以上三点,我们可以得知:
TCP通过校验和、确认以及超时重传这三个工具,来检测和重传受到损伤的报文段、并重传丢失的报文段、保存失序到底的报文段直至缺失的报文段到期,以及检测和丢弃重复的报文段。我们经常将TCP的这个特性称之为『差错控制』。
- 每个TCP报文段都有一个窗口大小字段,TCP为每个方向的数据传送各使用两个窗口(发送窗口和接收窗口)。接收窗口大小决定了接收窗口在溢出之前能够接收的字节数,接收窗口总是小于或等于缓存的大小。接收方可以向发送方反馈自己的窗口大小,也就是是自己能够接收的最大字节数,发送方会动态的调整自己的发送窗口,从而避免发送方发送过多的数据导致接收方无法及时接受,从而溢出。
通过第四点,我们可以得知:
TCP通过接收窗口的大小来调节生产者产生数据的速度和消费者消耗数据的数据,达到一种动态平衡。我们经常将TCP的这个特性称之为『流量控制』。
- 除了接收窗口会影响到发送方的窗口大小外,网络也是一个非常重要的影响因素。如果网络不能像发送方产生数据那样快的把数据交付给接收发,那么它就必须通知发送方网络有拥塞,需要调整发送窗口大小,放慢数据的发送速度。TCP处理拥塞的一般策略是基于三个阶段:
1、慢开始(指数增大)
2、拥塞避免(加法增大)
3、拥塞检测(乘法减小)
在慢开始阶段,发送方从非常慢的传输速率开始发送数据,但很快就把速率增大到一个门限值。当到达门限值后,速率增长开始放慢,直到检测到拥塞后发送方便回到慢开始或者是拥塞避免阶段。这儿我们将数据的传输速率称之为拥塞窗口。
真正的发送窗口大小 = min(接收窗口大小、拥塞窗口大小)
通过第五点,我们可以得知:
TCP使用了一个拥塞窗口和一个拥塞策略来避免拥塞,并在拥塞发生后检测和缓解拥塞。我们经常将TCP的这个特性称之为『拥塞控制』。
总结一下,TCP的有三个重要的特性,差错控制、流量控制和拥塞控制,正是因为这三个特性,我们将TCP视为一个可靠的传输层协议。
夜深了,睡觉去。如有错误,还望指正。