(一)Java网络编程之计网基础、TCP-IP协议簇、TCP、U

2022-05-24 本文已影响0人竹子爱熊猫

引言

就目前而言，多数网络编程的系列的文章都在围绕着计算机网络体系进行阐述，但其中太多理论概念，对于大部分开发者而言，用途甚微。因此，在本系列中则会以实际开发者的工作为核心，从Java程序员的角度出发，详细解读Java的网络编程核心内容。

一、计算机网络的“前世今生”与基础概念

先来看看维基百科对于 计算机网络 这个名词的解释：

计算机网络是指将位于不同地理位置，但具有独立功能的多台设备，通过通信设备和线路连接起来，在网络操作系统，网络管理软件、网络通信协议的协调管理下，实现资源共享和信息传递的计算机系统。

简单来说，计算机网络就是用于满足不同机器之间通信、共享的一种系统。

其实一开始计算机网络是用于军事化目的的，因美国军方需要一种多节点的通信技术，确保在其一部分节点被摧毁后，也能够确保通信依旧正常，因此组建了一个部门ARPA并在1966年完成了ARPANET（阿帕网）项目，该项目也是最早的计算机网络之一。
当然，后续随着科技不断进步，各种网络相关的技术百家争鸣，出现了各式各样的网络技术，但同时也带来了很大的局限性，例如：不同的计算机网络之间并不能相互通信、不同操作系统之间无法通信、覆盖范围及其有限等。因此，ARPA需要一种技术将不同的计算机局域网互联，最终ARPA组织创建了一个新的项目被称为internetwork因特网，也被称为“互联网”。

在internetwork项目的研发过程中，1974年，Robert E. Kahn以及Vinton G. Cerf两位教授正式提出了新的传输协议：TCP/IP协议，用于满足不同计算机网络之间的互联通信，ARPA到1982年接受TCP/IP选定为Internet主要的计算机通信系统，作为因特网通信的“基石”。

1.1、计算机网络的组成

从组成上而言，计算机网络主要由主机、协议、传输介质以及软件四部分组成。

主机：可以是手机、电脑、服务器、电子手表等任意计算机硬件。
协议：各类定义归法的网络通信协议，如TCP/IP、IPX/SPX、AppleTalk等。
传输介质：传输数据的通道，可以是实体铜线、电缆、光纤，也可以是无形的电磁波空间介质。
软件：涵盖所有联网的应用，如QQ、微信、支付宝、淘宝、京东等各类软件。

1.2、计算机网络的功能组成

计算机网络体系主要提供的两个核心功能就在于：

资源共享：资源子网实现。
数据通信：通信子网实现。

资源子网以及通信子网也对应着OSI中的上三层和下三层。

不过如果学习过计算机网络课程的小伙伴应该都知道，其实计算机网络是一个复杂而庞大的系统，由软件、驱动、硬件、线路等多部门共同组成，但对于这些理论性内容不再阐述，有兴趣的可以自行了解。

1.3、网络分层与OSI七层模型的由来

计算机网络是个非常复杂的系统，由于最初各个计算机网络体系结构不同，导致双方网络之间无法互通，因此，20世纪90年代，ISO国际标准化推出了OSI模型打算制定计算机网络体系标准。

简单来说就类似于国内的普通话，因为不同省份的方言不同，导致不同地方的人交流起来并不方便，因此定义了“普通话”这一标准，所有人都遵循该标准进行交流沟通。

但由ISO组织制定的OSI网络七层模型结构并没有得到广泛应用，实际中应用最广泛的是TCP/IP体系结构。换句话说，OSI七层模型只是理论上官方制定的国际标准，而TCP/IP体系结构才是事实上的国际标准。

PS：国际标准化组织提出的OSI模型未得到广泛应用的原因：
①制定时太过理想化，未考虑实际的应用场景。
②拆分过于精细化，实现起来过于复杂，运行效率并不高。
③OSI体系的制定周期过长，导致按其标准生产的设备无法及时投入市场抢占份额。
④OSI体系因为分层过多，设计也不合理，有些相同的功能在多个层次重复出现。

但因为TCP/IP体系中的最后一层没有制定规范的标准，所以对于学习计算机网络完善体系时会缺失一部分，所以又提出了一种折中方案，也就是综合OSI以及TCP/IP两个体系的优缺点，提出了一种五层结构的原理体系，因此在接触计算机网络体系时，通常都会存在三种分层结构：

法定标准体系：OSI七层结构。
实际应用体系：TCP/IP四层结构。
原理教学体系：五层结构。

二、OSI七层网络模型与TCP/IP协议簇

计算机网络体系采用的是分层结构，每个层次之间互不干扰，上层不需要关心下层的具体实现，下层只需要为上层提供服务即可。

在ISO组织定义的国际标准OSI模型中，是七层网络模型。
在实际应用最广泛的TCP/IP模型中，是四层网络模型。
当然，在计算机网络教学中，也提出了五层网络模型。

但无论多少层网络模型，其实本质上都是在叙述相同的内容，只不过拆分的精细度不同而已，三种网络模型对应如下：

各网络体系之间对应的关系

2.1、OSI七层网络模型

OSI七层网络模型中，每层的功能如下：

应用层：人与计算机网络交互的窗口。
表示层：负责数据格式的封装，如加密、压缩、编解码等。
会话层：建立、终止、管理不同端间的会话连接。
传输层：提供端到端（两台机器）之间的传输机制，以及提供流量控制、出错效验。
网络层：逻辑寻址，IP地址，在下两层的基础上向资源子网提供服务。
数据链路层：负责建立和管理节点间的链路，将数据封装成帧，进行可靠传输。
物理层：在介质媒体上传输比特流。

在TCP/IP体系中，将原本OSI体系中的应用层、表示层、会话层合并为了应用层，将数据链路层和物理层合并为了数据链路层，因此TCP/IP体系中只存在四层结构。

注意点：在最初因为技术问题，因此数据传输必须建立在物理实体介质的基础之上，但如今无线电的电磁波技术也可以做到利用空气作为介质，从而达到传输数据的目的。

在OSI分层体系中，上三层：应用层、表示层、会话层组成资源子网，下三层：网络层、数据链路层、物理层组成通信子网。

2.1.1、OSI模型的通信的封装与解析过程

在网络通信中，通信双方都必须是对等的，并且双方都遵守相同协议的，这样才可通信。好比举个例子：

竹子想发微信信息给熊猫，喊熊猫出来玩，但双方之间的通信基础必须对等，也就是说，熊猫的手机上也必须要安装了微信，否则竹子无法通过微信与熊猫出来玩。
但如果竹子说的是汉语，熊猫只能懂汉语，双方并未遵守相同的“协议”，那两者之间自然也无法进行通信。因此，通信的另一要素则是：通信双方都必须遵守相同的协议。

而在计算机网络中，当两台机器进行通信时，其过程主要包含数据的封装与解封：

OSI模型-数据传输过程
如上图，左侧是发送端，右侧是接收端，当发送端的应用尝试传输一条数据时，数据会根据网络分层结构，从上至下依次封装，每层都对数据做一定的处理，最后在物理层转换为比特流（二进制数据），然后传输至接收端。
因为双方之间遵守的都是相同的协议体系（网络模型），因此接收端会首先接收到比特流数据，然后从下至上依次解封数据，最终在应用层还原数据，从而达到通信的目的。

2.2、TCP/IP协议簇

TCP/IP应该是计算机网络中听的次数最多的词汇，但它并非单纯的指TCP和IP两个协议，而是一组协议的代名词，指由许许多多的网络协议一同组成的“协议簇”，TCP/IP协议簇主要组成如下：

TCP/IP协议簇
上面列出了一些TCP/IP协议簇中常用的一些协议，但整个协议簇是由大大小小上百个协议一同组成的（对于TCP/IP协议簇中的一些常用协议可参考：百度百科）。
在计算机网络体系中，每层都会存在多个协议，但一个协议只会隶属于一层。同时，协议也可以由软件、硬件两个维度来实现。

除开最常见的TCP/IP协议簇外，还有一些其他的协议组，如IPX/SPX、NetBEUI、AppleTalk等协议组。

2.2.1、通信协议的基本概念

前面的叙述中，更偏向于“空中楼阁”般的理论概念，比较生涩难懂，接下来我们以实际的TCP/IP协议出发，再对计算机网络更进一步阐述。

TCP/IP通信协议是最完整、使用最广泛的网络协议体系，它的魅力在于可使不同硬件结构，不同操作系统的计算机相互通信，通信协议中定义多方之间发送/接收的报文格式、顺序以及规则，其中语法定义了传输的报文格式，语义定义了报文传输规则，时序定义了报文传输顺序，计算机通信的本质就在于信息报文的相互交换。

2.2.2、协议数据单元(PDU)

计算机网络体系中，不同节点通信时交换的信息报文被称为协议数据单元（PDU），PDU主要由协议头信息+数据（SDU）组成，数据是指发送端需要传输给接收端的信息，而协议头信息中，则包含了完成传输所需的控制信息，如地址、长度、序号、分段标识、差错控制信息等。

基于TCP/IP体系而言，PDU在不同层存在不同的称呼，如下图：

协议数据单元（PDU）

2.3、计算机网络体系中各层综述

就目前而言，前面的阐述中已经将计算机网络中最常见的OSI、TCP/IP体系简单介绍明白了，但对于这些体系中，不同层的具体作用却并没有进行探讨。因此，接下来我们从自己设计一个计算机网络体系的角度出发，分别来探讨网络分层的必要性与每个分层的具体含义。

2.3.1、物理层

先来看最简单的通信模型：

直连式通信模型
如上图，两台电脑之间通物理媒体连接，互相传递信息，从而达到通信的目的。

在这种最简单的直连通信模型中，想要实现双方之间的通信，那应该考虑如下几个问题：

①连接两台电脑之间的传输媒体可以采用哪些介质类型。
②连接两台电脑时，两台电脑应该存在怎样的物理接口。
③传输数据时，使用何种信号表达比特流中的0和1。
④双方之间通信时，不同的传输介质，数据传输的速度标准又该是多少。

对于如上问题，我们可以将其全部归纳到“物理层”来解决，在该层中定义标准规范。

简单来说，物理层主要任务是负责在介质上正确的传送比特流，并规定物理接口的各种特性和物理设备的标准，如网线的接口类型、光纤的接口类型、各种传输介质的传输速率等。

2.3.2、数据链路层

但一般现在不会存在直连型网络，常用的计算机网络都是由多台机器共同组成的，如下：

总线式通信模型
在这种总线连接的通信模型中，当一台主机，比如A向D发送数据时，数据会通过总线传输至总线上的所有主机，此时D如何知道该条数据是发给自己的呢？其他主机又如何区分数据不是发给自己的呢？因此，对于这种多台机器组成的网络模型而言，我们也需要解决一系列问题，如：

①编址问题：如何区分总线上的各主机（如MAC地址），在发送数据时，带上目标主机的地址，其他主机根据数据中的目标地址确认是否是发给自己的。
②当其他主机收到传递的数据后，如何从比特流中正确区分出数据和目的地址。
③当同时多台主机共用主线时，如何协调各主机竞争总线，避免数据发生碰撞。

对于上述中的这些问题，可以全部划归到链路层处理。

因此可以得出，数据链路层主要任务是实现数据在不可靠的物理线路上的可靠传递，负责提供物理地址寻址、数据的成帧、流量控制、差错控制等功能，确保数据的可靠传输。

PS：对于这种总线型网络早已淘汰，目前常用的则是以太网的交换式通信模型：

交换式通信模型

2.3.3、网络层

到目前为止，解决了物理层及链路层中的问题后，就可以实现数据在一个局域网络中的传输了。但实际每天都接触的因特网是由无数个小网络和路由器互连组成的，如下：

广域网模型
因此只解决前面所叙述的问题还是无法在庞大的计算机网络中实现通信，毕竟之前因为只有一个网络，所以不需要对网络进行标识。但在这种广域网模型中，会存在大大小小无数个局域网，所以想要从一台主机将数据传输给另一台主机时，此时又该如何精准定位到某个网络中的具体主机呢？因此又产生了一系列的问题需要加以解决：

①如何标识各个网络及网络中的主机（网络和主机共同编址问题，如IP地址）。
②一台主机向另一台主机发送数据时，在广域网中往往存在多条链路可走，此时如何选择最合适的路由。

而对于这些问题我们都可以划归到网络层处理。

所以，网络层主要负责将网络地址翻译成对应的物理地址，并通过路由选择算法为数据的传输选择最适当的路径。

路由选择：路由主要包括路由表和路由算法两个方面，网络层会根据速度、距离(步跳数)、价格及网络拥塞程度等因素，在路由表的多条通信路径中找一条最佳路径。

2.3.4、传输层

至此，如果解决了物理层、链路层及网络层的问题，数据就可以做到在不同的网络中进行通信。但这对于普通用户而言仍然不够，因为一台主机上会安装多个应用程序，好比：

主机A上安装了QQ、微信、谷歌浏览器，当另一台主机向主机A发送数据时，那这些数据到底应该交给主机上的哪个进程处理呢？

因此还需要解决：

①如何解决进程之间基于网络的通信问题，如何标识网络通信相关的进程。
②如果数据在传输过程中出现丢包、误码等传输错误，又该如何处理。

这些问题可以被划归到传输层加以解决。

基于OSI模型而言，上三层资源子网主要负责用户数据处理，下三层通信子网主要负责数据通信，而传输层位于OSI模型中的第四层，是资源子网与通信子网之间的桥梁，因此，无论是在OSI亦或TCP/IP体系中，传输层都是至关重要的一层。

传输层的主要功能是：提供端到端之间的传输机制以及提供差错效验和流量控制，保证报文的正确传输。 在TCP/IP体系中，主要提供了两种传输服务：

“面向连接”的TCP可靠传输协议。
“面向无连接”的UDP不可靠传输协议。

2.3.5、应用层

应用层无论是在OSI亦或TCP/IP模型中，都是位于最高层，它是用户、各种应用程序和网络之间的接口，其功能是直接向用户提供服务，并完成用户在网络中的各种操作，应用层为用户提供的服务范围涵盖：文件目录服务、文件传输服务、远程登录服务、电子邮箱服务、打印服务、网络管理服务、安全服务、域名管理服务等，这些服务由应用层中各种协议及应用程序提供。

TCP/IP体系中将资源子网都合并为了应用层，但在OSI模型中，资源子网是分为应用层、表示层、会话层三个层次的，也就是拆分粒度更精细化，服务也更为精细化。

2.3.5.1、OSI-表示层

主要负责应用层的用户数据处理，例如数据编/解码、数据的加密解密、数据压缩、数据格式处理等，其作用如其名，主要处理用户信息的表示问题。

2.3.5.2、OSI-会话层

会话层位于OSI模型的第五层，是用户应用程序和网络之间的接点，主要负责网络中的两节点间建立、管理和终止通信。会话层的功能涵盖：建立通信链接、保持会话过程、维持通信链接的畅通、同步节点间的对话信息、决定通信是否终止以及通信中断时决定从何处重新发送。

简单而言，应用层主要是为用户与网络之间，提供各类可“接触”的窗口。

2.3.6、TCP/IP体系中数据的通信过程

与之前的OSI模型的通信过程相同，TCP/IP体系中，一端想往另一端传输数据时，数据也会经历封装与解封的过程，数据经过每一层时都会加入当前层的协议信息，从而形成本层的PDU，继而向下传递，直到最终被转换为比特流数据，通过传输介质转换为信号传输到另一端，另一端接收到之后则会依次解封数据，过程如下：

TCP/IP体系-数据通信过程

同比生活，也就是类似收发快递的过程：

发件：[发件人]→[货物]→[驿站]→[快递公司站点]
传输介质：[运输路线]→[中转站]
收件：[快递公司站点]→[驿站]→[货物]→[收件人]

2.3.7、计算机网络基础总结

到目前为止，计算机网络中一些比较重要的基础概念已介绍完毕，前面的论述中，从计算机网络的诞生，到法定的OSI标准体系以及TCP/IP体系进行了简单分析，对于开发者而言，这些基础知识了解即可，想要深入学习的小伙伴可观看《湖科大的计算机网络视频教学》，讲的比较透彻切通俗易懂。

三、IP网络协议与TCP、UDP网络传输层协议

前面更多的在叙述计算机网络的整体的结构，接下来则准备对计算机网络中几个常见的网络协议进行阐述，如IP、TCP、UDP等协议（HTTP、HTTPS放在下章讲解）。

3.1、IP协议

当应用层的数据被封装后，想要将数据在网络上传输，数据究竟要被发往何处，又该如何精准的在网络上定位目标机器，此时起到关键作用的就是“IP协议”。
IP协议的作用在于把各种数据包准确无误的传递给目标方，其中两个重要的条件是IP地址和MAC地址。其中IP地址就是所有主机在网络通信中的唯一标识，但由于IP地址是稀有资源，不可能每个主机都拥有一个IP地址，因此路由器里面会记录我们主机的MAC地址，通常的IP地址是路由器根据MAC地址生成的，而MAC地址是全球唯一的。

举例：IP地址就如同是物流线路上的驿站地址，而MAC地址就是具体货架上货物的位置。

之前的IP地址采用的IPv4格式，目前大部分主机都已向IPv6过渡。

3.1.1、IP地址的组成与分类

IP地址一般由网络标识(NetID)和主机标识(HostID) 两部分组成，其中网络标识对应着网络地址，表示其局域网属于互联网中的哪一个网络；主机标识对应着一台机器的主机地址，表示机器属于该局域网络中的哪一台主机。
通常情况下，一个IP存在四组数字，每组数字对应着八位二进制数字（一个IP地址共计32Bit），每组之间分别用.隔开，其中不同类型的IP地址，表示网络标识和主机标识的数字段也不同，目前的IP地址主要可分为A、B、C、D、E五大类，如下：

IP地址分类

A类IP

A类地址由8位网络标识+24位主机标识组成，也就是之前的四组数字中，第一组表示网络地址，而后三组代表主机地址。网络地址的最高位，即首位必须为0，其中0和127都为保留位，因此A类IP的网络地址范围为1~126(1.0.0.0~126.0.0.0)，也就代表着可用的A类网络有126个，每个网络中最大可容纳一千多万台主机（2²⁴-2）。

PS：为什么A类网络的地址范围是1~126呢？
因为A类IP中用8bit表示网络标识，首位需要保留为0，因此剩下的7bit能够表示的最大数字为127，末位127也需保留，因此A类网络地址的取值范围为1~126。

示意图如下：

A类IP-示意图

例如32.44.128.5这个地址，其中第一段代表网络地址，剩余三段表示网络中的主机地址。

B类IP

B类地址由16位网络标识+16位主机标识组成，因此IP中第一段和第二段都为网络标识，其中前两位为保留位1、0，因此B类IP的网络地址取值范围为128~191(128.0.0.0~191.255.0.0)，总计可用的B类网络数量为16382个，每个网络中可容纳6万多台主机（2¹⁶-2）。B类IP组成示意图如下：

B类IP-示意图
例如128.123.11.32这个地址，其中前两段为网络地址，后两段表示网络中的主机地址。

C类IP

C类地址由24位网络标识+8位主机标识组成，也就是说，整个IP地址中，前三段都为网络地址，最后一段为主机地址。C类地址中，前三位都为保留位，即C类网络的最高位必须为1、1、0，因此C类网络地址的取值范围为192-223(192.0.0.0~223.255.255.0)，粗略计算下来，C类网络的数量可达209万左右，每个网络中允许存在254台主机（2⁸-2），组成示意如下：

C类IP-示意图
如192.0.0.121这个IP，前三段为网络地址，最后一段则为网络中的主机地址。

D类IP

D类和后续的E类属于特殊的IP地址，D类地址被称为广播或组播地址，其最高位必须是1、1、1、0，因此取值范围为224~239(224.0.0.0~239.255.255.255)，如下：

D类IP-示意图

E类IP

E类地址则属于保留的地址，为以后接入更多的网络预留的IP，其最高位必须为1、1、1、1，即E类IP第一段的取值范围为240~255(240.0.0.255~239.255.255.254)：

E类IP-示意图

但255.255.255.255这个全1的IP属于特殊含义的地址，表示当前子网的广播地址，如同全0的IP：0.0.0.0代表本机地址一样，带有特殊的含义。

IP分类小结

因不同类型的网络IP规模不同，所以它们也分别应用于不同的场景，如：

①A类IP适用于大型网络，由于单个网络中可容纳的主机数非常巨大，因此常被保留给政府机构使用。
②B类IP适用于中型网络，一般会被分配给公益组织、中大型企业等。
③C类IP适用于小型网络，这种IP适用于所有需要网络的个体和小集体，如网吧、家庭、个人电脑等。
④D类IP用于组播。
⑤E类IP用于保留和实验。

3.1.2、子网掩码

子网掩码又被称为网络掩码、地址掩码、子网络遮罩，它的作用主要有两个：

一、区分IP中网络地址和主机地址。
二、划分子网，扩大网段内的可用IP数目。

但默认的子网掩码值也并非都相同，不同的网络类型存在不同的默认掩码，如：

A类网络的默认子网掩码：255.0.0.0
B类网络的默认子网掩码：255.255.0.0
C类网络的默认子网掩码：255.255.255.0

一个子网掩码决定着一个子网（独立的单个网络）内可容纳的主机数量，计算公式为：可容纳的主机数量=(2的n次方)-2。这个n可以理解为二进制掩码中0的数量，例如：

A类默认掩码：255.0.0.0转换为二进制为：11111111.00000000.00000000.00000000，后面有24个0，因此可容纳的主机数量为(2的24次方)-2，即16777214台主机。
C类默认掩码：255.255.255.0转换为二进制为：11111111.11111111.11111111.00000000，后面存在8个0，因此C类网可容纳主机数量为(2的8次方)-2，即254台主机。

修改子网掩码为局域网扩容

在中型企业中，经常会碰到一个问题，公司使用C类网，因此子网内可容纳的主机（电脑）数量为254台，但实际公司的电脑可能超出这个数量，如存在440台电脑，那此时如何更改路由器的设置可以让440台电脑同时上网呢？

方案一：增加路由器的数量，更改多个路由器配置。
方案二：通过改变子网掩码的方式为局域网扩容。

，对于第一种方案需要增加经济成本，因此可以暂不考虑。来看看第二种方案，此时将子网掩码修改到多少合适呢？计算过程如下：

①：主机数量/子网可容纳主机的最大数，再向上取整，即：
- 440/254≈1.73，向上取整结果=2，也就是容纳440台电脑需要2个网段。
②子网掩码决定着子网内可容纳的主机总量，那么设：2的N次方≈主机数量，求N：
- 2的N次方=440，可算出N>8，即N=9最合适，因此掩码低位应当存在9个0；
- 即：11111111.11111111.11111110.00000000，转换为十进制：255.255.254.0；
- 因此最终计算出子网掩码为255.255.254.0最合适。

此时假设路由器的LAN口配置是197.118.0.1，那根据第一步计算出的网段数量，分配两个子网段，197.118.0.1~197.118.1.254即可满足需求，采用这种更改子网掩码的方式，就在不增加路由器的情况下，也能达成了为局域网增加可用IP数的需求。

最终可用IP范围为：197.118.0.1/23，可用IP地址共计510个。
嗯？xxx/23是什么东东？其实这个值是子网掩码的简写方式，之前算出来的子网掩码为255.255.254.0，转换为二进制，一共存在23个1，因此可以简写为xxx/23。

如何判断两个`IP`处于同一个网段

两个IP处于同一网段的前提是：两个IP的网络标识必须一致，那如何计算网络地址呢？

网络地址 = IP地址 “位与” 子网掩码。

如C类网197.118.0.198、197.118.1.114两个IP，子网掩码为255.255.254.0，如何计算网络地址？首先需要将掩码与IP全部都转换为二进制，如下：

197.118.0.198：11000101.01110110.00000000.11000110
197.118.1.114：11000101.01110110.00000001.01110010
255.255.254.0：11111111.11111111.11111110.00000000

首先将197.118.0.198网络部分（前三段）的二进制值同掩码进行位与运算，最终可以计算出：

11000101.01110110.00000000，转换为十进制为197.118.0。

紧接着再197.118.1.114网络部分的二进制值同子网掩码进行位与运算，计算结果：

11000101.01110110.00000000，转换为十进制为197.118.0。

最终可得到结果：197.118.0.198、197.118.1.114的网络地址都为197.118.0，代表着这两个IP处于同一个网段。

子网掩码小结

子网掩码这块的内容，如果你不是专门做网络相关的工程师，哪适当了解即可，如不理解其内容也无关紧要，作为软件开发者并不需要太过深入研究。

3.1.3、IP协议核心流程

经过上述内容学习后，我们已经对IP协议中的IP组成、分类、计算等知识已经建立起了基础，接下来在重点看看IP协议的核心流程。IP协议核心主要包含IP寻址和路由控制。

前面曾提及：网络上任何一台主机都会存在自己的IP地址，那么当应用层数据被封装后，能够精准定位到目标主机的关键原因就在于IP，可以通过IP地址在网络中进行寻址，从而让数据到达目的主机。

但在实际的网络通信过程中，可能有时数据发送的链路非常遥远，如你从中国向日本网友发送一条数据，那么由于一些网络抖动、物理介质损坏都会导致数据丢失。但此时又该如何确保数据“安稳”到达目的地呢？

为了防止数据由于介质损坏或网络抖动等原因丢失，因此会在数据的传输链路中加入一些“中转站”，也就是所谓的“路由器”，一方面可以备份数据，查看数据是否丢失，如果丢失会重新发送，另一方面也可以控制数据的转发。当然，这个控制数据转发的过程也被称为“路由控制”。

正因为路由控制的存在，所以即使网络复杂多变，也能够通过路由器的控制将数据“安稳”送达至目的主机。

但因数据传输过程中，数据从发送方到接收方之间存在的链路是不可预估的，因此数据传输的链路上可能会分布很多路由器。本质上数据在链路中传输，就是一个个路由器相互之间交换数据报的过程，当然，这个过程也被称为“跳”。

跳：数据包经过一台路由器就是一跳。
好比一个网络中存在四个路由器：A、B、C、D，如果局域网A中的主机要给局域网D中的主机发送数据，从理论上来说就会经过B、C、D三台路由器，也就是会经过三跳。

哪当数据到达某个路由器后，它如何知道“下一跳”该去往何处呢？此时中转的路由器就会解析收到的数据报，然后从中解析出IP数据报，然后查询自身的路由表，从而选择“下一跳”该走的路线，最终不断重复该过程直至数据到达目标主机。这种多次转发数据的过程也被称为“多跳路由”。

3.1.4、IPv4与IPv6

目前的网络几乎大部分还是基于IPv4版本，但同时大部分应用程序也开始支持IPv6，IPv6是“Internet Protocol Version 6（互联网协议第6版）”的缩写，是用于替代IPv4的下一代IP协议，也就是下一代互联网的协议。

IPv6相较于IPv4而言，主要不同点在于：

①地址空间不同，IPv4地址采用32位长度，IPv6的地址则采用128位长度。
②IPv6的路由表会比IPv4更小、更精细。
IPv6的组播支持以及对流的支持要强于IPv4。
IPv6的安全性更高，使用IPv6的用户可对网络层数据进行加密。
协议扩充不同，IPv6允许协议进行扩充，而IPv4不允许。

前述的IP协议分析都是基于IPv4版本而言的，因为目前主流的网络版本还是IPv4，但如今也逐步向IPv6过渡。

3.2、“面向连接”的TCP可靠传输协议

TCP(Transmission Control Protocol)传输控制协议是面向连接的可靠传输协议，是位于传输层的核心协议之一，在不可靠的互联网络上，IP协议只提供了简单不可靠的包交换，但网络中不同主机之间经常需要一种可靠的、类似于管道一样的连接、流机制，去稳定传输一些数据，如视频、音频、图片等大文件数据。
因此TCP应运而生，TCP协议是为了在不可靠的互联网络上提供可靠的端到端之间，字节流传输而专门设计的一个传输协议，TCP中采用字节流传输数据。

3.2.1、TCP协议简介

先来看看TCP的报文头结构：

TCP报文头
TCP报文头结构中的各字段释义如下：

①源端口/目的端口：指数据发送方的应用进程端口号及接收方的进程端口号。
②序号：TCP为了保证数据的可靠传输，会对分段数据标注序号，勇于组装和确认数据的正确性。
③确认序号：当接收方收到接收到本次数据时，下次需要发送的数据段序号。
④首部：表示TCP报文头的长度，因为TCP头长度可变性，因此需要在头信息中声明每个头的长度。
⑤保留位：预留一些空间给未来拓展时使用。
⑥URG：表示本次发送的报文数据中是否紧急数据。
⑦ACK：确认信号，当报文中ACK=1的时候表示正确或同意。
⑧PSH：表示接收方应该尽快将这个报文交给应用层，为后续数据腾出空间，不要停留在缓冲区。
⑨RST：如果收到RST=1的报文，说明与主机的连接出现严重错误（如主机崩溃），必须释放连接，然后重新建立连接。
⑩SYN：建立一个新连接，SYN=1表示这是一个请求建立连接的报文段。
⑪FIN：断开一个连接，FIN=1表示通知告知对方本段要关闭连接了。
⑫窗口大小：表示现在允许发送的数据量，当到达此值，需要ACK确认后才能继续发送数据。
⑬效验和：通过CRC算法提供额外的可靠性，用于效验数据正确性。
⑭紧急指针：标记紧急数据在数据字节流中的位置。
⑮选项：这块属于动态的可选择参数。主要选项如下：
- 最大报文段长度、窗口扩大、时间戳。
数据：报文段传输的数据内容（不属于TCP报文头的范畴内）。

当应用层向传输层传递数据时，TCP会首先对数据流进行分段，将大的数据拆分成一个个的数据报文段，然后会将封装好的数据包传递给网络层的IP层。同时，为了防止数据在网络传输中丢包，TCP也会对每个数据包分配一个序号，当接收方成功收到发送的数据后，会返回一个ACK确认，如果发送方在规定的合理时间（RTT）内未收到接收方的ACK，那么对应的数据包会被认定为已丢失，发送方会将该段数据重新传输。

当数据接收完成后，TCP会用校验和函数来检验数据是否正确，在发送方和接收方都需要计算该值，发送方计算后会将该值放在TCP头中携带发送，接收方接收到数据后，也会再次计算该值，再与报文头中的值进行比对，确认数据的正确性。

3.2.2、连接管理机制 - 三次握手与四次挥手

由于TCP是基于管道连接式通信的协议，因此在数据传递之前，必须要先建立连接，当数据传输完毕后，也必须要关闭连接。因此，这就引出了面试过程中人尽皆知的问题：“为什么TCP是三次握手，四次挥手！”

想要了解清楚这个问题的答案，那么得先了解TCP建立与关闭连接的过程。

TCP的三次握手

所谓的TCP三次握手，其实是指TCP建立连接的过程，因为TCP属于可靠性的传输协议，因此在发送数据前必须要先确保发送/接收数据的双方状态正常，因此需要经过“三次握手”的过程，具体如下：

TCP建立连接-三次握手

①客户端向服务端发送建立连接的数据包SYN=1,seq=x，然后进入syn-send等待确认连接状态。
- SYN=1：代表请求建立连接。
- seq=x：当前数据包的序号。
②服务端接收到请求建立连接的数据包后，允许建立连接的情况下，会返回响应报文SYN=1,ACK=1,seq=y,ack=x+1给客户端。
- SYN=1：TCP是双全工协议，因此服务端也需向客户端发送SYN=1信号。
- ACK=1：确认客户端建立连接的请求。
- seq=y：表示当前服务端返回给客户端的序号。
- ack=x+1：确认客户端序号x之前的请求都已收到。
③因为是双全工协议，连接是双向的，因此客户端也需确认一下服务端的连接请求，收到服务端的SYN=1后，也需返回ACK=1,seq=x+1,ack=y+1的数据包。
- ACK=1：表示确认服务端的连接建立请求。
- seq=x+1：当前数据包的请求序号。
- ack=y+1：确认服务端序号y之前的数据都已成功接收。

经过如上三个步骤，客户端和服务端双方之间确认请求后，连接会成功建立，紧接着双方都会处于estab-lishen状态，数据可以正常传输。

当然，这个过程略微有些难理解，换个日常生活的例子来快速理解一遍！

①特种兵-竹子：我是竹子，熊猫收到请回答！收到请回答！
②指挥部-熊猫：熊猫收到，我是熊猫，竹子能收到吗？收到请回答！
③特种兵-竹子：竹子收到！竹子收到！
通话开始.........

TCP的四次挥手

当“三次握手”完成后，客户端和服务端之间会成功建立连接，从此开启双方端到端之间的数据传输，当一方数据传输完成后，会尝试中断连接，因此又会经历“四次挥手”的过程，如下：

TCP断开连接-四次挥手

①客户端完成数据传输后，会发出FIN=1,seq=u关闭连接的报文，然后等待服务端响应。
- FIN=1：代表请求关闭连接。
- seq=u：请求序号。
②服务端收到客户端的“关闭”请求后，会给客户端返回确认关闭的报文：ACK=1,seq=v,ack=u+1。
- ACK=1：确认客户端“关闭连接”的请求。
- seq=v：请求序号。
- ack=u+1：确认客户端序号u及其以前的数据都已成功接收。
- 客户端传输完成数据后，会告诉服务端自己要关闭连接了；
- 但服务端可能数据还未传输完成，因此会继续传输自己的数据，直至自身的数据也传输完成后，也会告诉客户端：自己也要关闭连接了。
③服务端传输完成自己的数据后，向客户端发送关闭连接的报文：FIN=1,ACK=1,seq=w,ack=u+1。
- FIN=1：表示自己也要“关闭连接”了。
- ACK=1：确认收到了之前的数据。
- seq=w：请求序号。
- ack=u+1：确认客户端序号u之前的数据都已成功接收。
④客户端接收到服务端“关闭连接”的请求后，给服务端响应确认报文：ACK=1,seq=u+1,ack=w+1。
- ACK=1：确认服务端“关闭连接”的请求。
- seq=u+1：请求序号。
- ack=w+1：确认服务端序号w之前的数据都已成功接收。

前面提及过，因为TCP是双全工的协议，因此双方都可以主动释放连接，在TCP中，当一方数据传输完成后，就会主动关闭连接，也就会经历“挥手”的过程，同样我们也可以举个通俗一些的例子来认识这个过程：

①特种兵-竹子：竹子汇报完毕，请指示！
②指挥部-熊猫：指挥部收到！..&*/?..!^...继续说完自己要交代的任务。
③指挥部-熊猫：这里是熊猫，任务已指示完毕！
④特种兵-竹子：竹子收到！
中断通话.........

三次握手是指TCP建立连接需要发送三个数据包，主要目的是在于：为了确认双方的接收能力和发送能力是否正常、指定自己的初始化序列号为后面的可靠性传送做准备。

四次挥手是指TCP关闭连接时需要发送四个数据包，主要目的在于：当客户端发送完数据后，给服务端发送“我要关闭连接了”的请求，然后服务端告知客户端收到了“关闭请求”，但此时服务端会继续向客户端传输未发送的数据，客户端也照旧可以接收服务端的数据，直到服务端的数据传输完成后，服务端也会发出“关闭连接”的请求，客户端同意后，最终才会断开连接，从而保证数据正常可靠的交互。

本质上“三次握手与四次挥手”就是在指TCP建立与关闭连接的过程，搞明白建立和关闭连接的过程后再来看看最开始的问题：“为什么TCP是三次握手，四次挥手！”

为什么TCP是三次握手，四次挥手

因为建立连接“握手”时，当服务端接收到“客户端想与服务端建立连接”的请求后，可以立马返回“同意+与客户端建立连接”报文，客户端也确认建立连接后，就可以称为“握手完成”。
但关闭连接时的“挥手”，因为一方数据传输完成后就会提出关闭连接，不过另外一方可能还依旧存在数据未发送完成，因此服务端就不能在“确认关闭”连接的时候，也同时发出“关闭连接”的请求，因为自己的数据还没发送完成呢，所以会等到自身的数据全部传输后，再主动向客户端发起一次“关闭连接”的请求，等待客户端“确认关闭”后，从而完成整个“挥手”动作。

3.2.3、TCP中的沾包问题

要理解“TCP沾包”问题之前，首先要理解TCP传输数据的方式。TCP在传输数据时，会给每个分割后的报文段分配一个序号，接收方在收到数据后，会按照序号排好，然后将其放置在TCP缓冲区中。同时TCP为了提升传输速度，若连续几次发送的数据都很少，TCP会根据优化算法把多个数据合并成一个包发出。

沾包问题：多个数据包在一块儿，无法确定每个数据包之间的分割边界，因此从应用层的角度看来，就好像多个数据包“沾”在了一起。

对于TCP传输层而言，发送方和接收方都有可能造成数据沾包问题。

发送发导致的数据沾包问题：TCP为了优化传输速度，往往会等收集到足够多的数据后才发送一包数据，因此发送发传输的数据就出现了沾包问题。
还有一种情况则是：当需要发送的数据大于MSS规定，那么TCP就会对数据包进行拆包，一个数据包会被分开传输，最终导致数据出现沾包问题。

接收方导致的数据沾包问题：TCP中，如果数据被接收后，应用程序没有及时读取缓冲区中的数据报文，就会导致缓冲区中堆积大量的报文数据。这种情况下，站在TCP层的角度而言，看到的是一个个的数据报文依次排列着，但对于应用层的程序来说，看到的就是一串连续的字节流数据，应用程序无法知道每个数据包之间的分割边界，站在应用层的角度来看，所有的数据包就好像都“沾”在一起了一样，应用程序根据预先设定好的大小从缓冲区中接收数据，最终会一次性读取到多包数据。

沾包问题解决方案

①当使用TCP短连接时，不必考虑沾包问题。
②当发送无结构数据，如文件传输时，也不需要考虑沾包问题，因为这类数据只管发送和接收保存即可。
③如果使用长连接，那么则需要考虑沾包问题：
- 如果发送的报文都是相同的结构，那么可以在首部中添加数据长度，接收方根据首部中记录的数据大小读取数据。
- 将每个数据包封装成固定长度，不够的用0补齐，接收方每次按照固定大小读取数据即可。
- 在数据之间设置边界，比如添加特殊符号，这样接收方收到数据时，根据特殊符号分割数据即可。

3.2.4、TCP协议中的其他核心概念

因为TCP既要保证可靠性，同时又要尽可能提高传输性能，所以整个TCP设计的尤为复杂，牵扯出的概念也很多，比如为了保证数据的可靠传输，TCP中提供的机制：

效验和：数据接收完成后进行效验。
序列号：数据按顺序传输和接收。
确认应答：收到数据之后返回ACK应答。
超时重试：超出规定时间后，发送方未收到ACK应答，则会重新再次发送数据。
连接管理：建立和管理连接时，都会经历三次握手、四次挥手确保数据可靠传递。
流量控制：TCP根据接收端的处理能力, 来决定发送端的发送速度，避免丢包。
拥塞机制：TCP采用慢启动机制，由于网络拥塞情况不确定，刚建立连接时会先发送少量数据的包，“摸清楚”网络拥塞程度后，再优化成合适的数据包大小传输。

在确保了数据可靠传输的同时，TCP也提供了一堆机制尽可能提高数据传输性能：

滑动窗口：因为接收一条数据，返回一个ACK这种应答机制大大影响了传输效率，因此TCP中引入了一个新概念：窗口，窗口大小是指无需等待ACK就可继续发送数据的最大值，当收到第一个ACK确认应答后，窗口向后移动，发送后续的数据，因为这个窗口不断向后滑动，所以叫做滑动窗口。
快速重传：结合上述的滑动窗口机制，当某个数据出现丢包时，接收方会持续向发送方传输相同的ACK应答序号，当发送方连续三次接收到相同的应答序号时，就会对该序号的数据报进行重发。
延迟应答：接收方应答速度越快，那么窗口会越小，而延迟应答就是指：接收端稍等一会儿后再发送应答信号，应答速度越慢，窗口越大，网络吞吐量就越大，传输效率就越高（但受到数量和时间的限制）。
捎带应答：在一般数据的传输过程中，大多数情况下都是一发一收的过程，因此ACK应答可以“搭数据的顺风车”，和接收方回应的数据报文一起返回，如三次握手中的第二次握手，采用的就是捎带应答机制，ACK应答信号和建立连接的数据报一起发送给了客户端。

同时，TCP协议中，每建立一条连接都会维持九个定时器，可以适当了解：

超时重传定时器：超出规定时间范围后，未收到应答信息，对数据进行重发。
保活定时器：如果已建立的连接超出规定时间后还没有数据交互，则保活定时器超时，向对端发送保活探测包，根据客户端的反馈决定是否继续维持连接，如客户端正常则重置定时器时间，如客户端异常则关闭TCP连接。
持续定时器：也被称为零窗口探测定时器，当接收方缓冲区数据满了之后，会在应答报文中通知发送方将窗口置0，阻止发送方继续发送数据。当缓冲区数据被读取后，会再向发送方发出一个ACK，通知发送方可以继续传输数据，但为了防止该ACK丢失导致死锁现象出现，发送方也会启动零窗口探测定时器，每隔一段时间，发送方会主动发送探测包，迫使接收端响应，从而得知其接收窗口有无打开。
ACK延迟定时器：延时应答的定时器，和超市重传定时器功能类似。
SYNACK定时器：新建连接时等待ACK应答的定时器，超出时间后会关闭连接。
FIN_WAIT2定时器：关闭连接时等待ACK的定时器，超时后会取消“关闭连接”。
ER延迟定时器、PTO定时器、TIME_WAIT定时器：这三玩意儿没研究过。

3.3、“面向无连接”的UDP不可靠传输协议

UDP(User Datagram Protocol)协议是传输层的一个不可靠传输协议，它为应用程序提供了一种无需建立连接就可以发送封装的IP数据包的方法。在传输层中，与TCP协议互补，UDP除了给应用层提供了发送数据包的功能外，几乎没有做任何其他事情。而面向连接的TCP恰恰相反，几乎做了所有的事情。

刚刚提到过，UDP仅为应用层提供了发送数据报的功能，主要就是指UDP对IP协议的扩充：

①建立在IP协议的基础上，扩展出端口号，可使数据分发到具体的应用程序。
②建立在IP协议的基础上，扩展出数据传输过程中的数据差错效验机制。

接下来先看看UDP的报文头结构。

3.3.1、UDP的报文头

UDP报文头
对比TCP复杂的报文头结构，UDP的头部就显得比较简单了，整个头共8字节：

①源端口/目的端口：指数据发送方的应用进程端口号及接收方的进程端口号。
②报文长度：Header+Data的总长度，因为UDP头为8字节，所以该值最小为8。
效验和：检测UDP数据报在传输中是否有错，有则丢弃（UDP检验和并非必须的），就算效验时检测出错误，也仅只是丢弃数据包，不会对数据进行纠正，也就是不会重发数据报。

3.3.2、UDP核心流程

UDP是一个无连接的协议，因此采用UDP传输协议的程序，在传递数据时，不会存在建立/释放连接的过程。当数据需要传输时，会对于应用层的数据简单的封装，也就是加上自己的UDP头后，直接会将数据丢给IP层，然后交由链路传输。

正因为如上特性，因此UDP的传输速度仅受到数据生成的速度、计算机算力和传输带宽的限制。

在接收端，UDP会把每个消息段放在队列/缓冲区中，程序每次从队列中读一个消息段。当然，接收端收到数据后，也会对数据做效验，但效验完成后，如若数据存在差错，那UDP只会单纯的丢弃该数据包，不会要求发送端重发数据。

因为由于UDP高效的传输性能，因此常备应用在广播通知、音频通话、视频传输等多媒体数据流业务，而且这类业务中，如果有一个数据包丢失，在很短的时间内就会有另一个新的数据就会替换它，因此就算数据传输不可靠也无关紧要。

3.3.3、UDP中的丢包问题

由于UDP的不可靠传输，因此数据出现丢包是很常见的事情，一般UDP中造成数据丢包的原因主要如下：

①接收端处理数据时间过长，导致不同包之间的数据处理间隔时间过长，造成丢包。
②UDP单个数据包过大，导致缓冲区快速被填满，接收端程序来不及处理造成丢包。
③发送端数据发送频率过快，接收端处理速度跟不上，从而导致数据丢包。
④发/收双方之间存在网络不稳定，导致数据无法正常分发，从而导致丢包。
一般来说，丢包的原因很简单，要么是网络问题，要么就是接收方处理速度跟不上导致的。

丢包问题解决方案

①如果是数据包过大造成丢包，那么则可以切割数据后分批次发送。
②如果是发送频率过高导致丢包，可以适当控制频率/减小流量，或调大缓冲区。
③如是缓冲区最大了，还是由于处理不过来导致数据丢包，那么可以在程序内再实现一个缓存区，先读取数据到程序中缓存，从而提升接收端的吞吐量。
④如果程序中对于丢包容忍率很低，那么可以自己实现重发机制，或直接切换TCP实现。

四、腾讯QQ通信原理剖析

腾讯QQ、微信两应用是国内社交通信软件中当之无愧的“霸主”，其中的QQ是一个基于TCP/UDP两个协议相结合的通讯软件。其中聊天首先采用UDP打洞方式，其次考虑TCP通信，当然，对于文件传输、表情包发送、QQ空间等是采用TCP传输。

4.1、登录原理

曾经的老版QQ是可以自己选择登录方式的，也就是用户自己可以选TCP或UDP方式登录，如下：

老版QQ-登录
但目前的新版QQ中，都是采用基于TCP协议的HTTP方式登录，即与我们本身做的登录原理大致相同，先通过调用后端接口获取令牌信息，然后认证.....，最后登录完成后，QQ会保持一条TCP连接来维持在线状态。

4.2、通信原理

QQ的主要通信方式是基于UDP打洞技术，通过服务器中转方式实现的信息传输，这听起来是不是很不可思议？QQ作为“顶级”的聊天软件，怎么可以采用这样的不可靠方式来传输消息呢？

这里面牵扯到很多原因，有历史原因，也综合考虑了服务器负载、网络复杂度、服务器数量/网络带宽成本问题、实现难度等多方面因素导致的。

由于UDP传输不可靠，因此腾讯采用了上层协议来保证可靠传输：如果客户端使用UDP协议发出消息后，服务器收到该包，需要使用UDP协议发回一个应答包，通过这种方式来保证消息无遗漏的传输。

不过有时候之所以会看到“消息发送失败的红色感叹号”，但对方又收到了这个消息的情况，就是因为客户端发出的消息，服务器已经收到并转发成功，但客户端由于网络原因没有收到服务器的应答包引起的。
也包括网络比较差的情况下，QQ信息发送之后，对方接收到的顺序跟你发出的不一致，这个也是由于UDP无序导致的。

4.3、文件传输原理

当A想要向B传输一个文件时，A首先会向服务器发出一个文件传输的请求，服务器接收到该请求后，会将其转发给B，同时会将A的临时IP发送给B，如果A、B两个客户端在同一内网，那么B会直接尝试连接A，从而达到文件传输的目的。
但如若A、B并不在同一个局域网，那么A的文件传输操作就会由服务器进行文件中转，因为服务器具备公网IP，因此A、B两个客户端都可以连接到服务器，于是A、B最终就通过这种中转的方式顺利达成文件传输的目的。

4.4、音/视频通话原理

前面提到过，QQ的文字聊天几乎都是通过服务器中转的方式工作的，因为这种形式一方面可以保证“记录同步到云端”，另一方面也方便“刑事侦查”。
但音/视频通话，数据传输全经过服务器中转，对于服务器是一个沉重的负担，所以QQ的音/视频通话本质上是通过NAT穿透+P2P对等通信实现的，当然，在P2P直接通信失败时，会退而求次，服务器介入处理，通过中转模式实现传输。

大概过程如下：

A打算与B进行视频通话，那会在“启动时”向服务器发送一个“通话请求”。
服务器接收到请求后，会先获取通话双方的IP/Prot，然后将其相互交换。
服务器协助穿透NAT，A、B双方根据服务器分发的地址建立连接。
A、B双方连接对端地址，然后相互传递数据，从而达到通话数据传输的目的。

从如上过程中可以得出：QQ客户端之间“通话”，如果可以直接P2P通信，则服务器把他们各自的公网IP、端口号分发给彼此，这样他们的流量数据可以P2P传输，服务器在其中只分发QQ客户端IP、端口号信息，不会负担太大。但如果P2P通信失败，服务器会介入，采用服务器中转方式完成。

如果NAT无法穿透，那则无法进行P2P通信，无法穿透的原因也可能由于地理位置、网络类型限制等多方面因素导致。

P2P通信翻译过来也就是端到端通信，在P2P模型中，服务器只作为客户端地址的中转站存在，不需要承担高昂的流量成本。

4.5、腾讯QQ原理分析小结

在上述过程中，我们只能大概分析QQ通信其中的原理，并不能保证这是腾讯内部具体的实现方案，因为细致的具体过程只有腾讯自己明白。也包括其具体实现定然复杂千百万倍，并非三言两语之间就可阐述清楚，因此对于QQ通信原理的分析部分，大概理解其原理即可。

五、计算机网络基础与网络传输协议总结

在本章中，对于计算机网络的基础内容进行了全面阐述，从最初的计算机网络起源开始，到常见的网络体系、网络分层结构、IP网络协议、TCP可靠传输协议、UDP不可靠传输协议以及腾讯QQ软件原理分析等多块内容进行了分析，本章旨在先为后续篇章打下网络编程的基础，方便后续撰写其他内容时做好准备。