TCP/IP协议族边学边想

2017-08-22 本文已影响75人 Nemocdz

写在前面

最近读了《图解TCP/IP》这本书，重新理解了大二囫囵吞枣，应付考试而学习的“计算机网络”和“TCP/IP”这两门课中一些未理解的知识，和疑惑的问题。

网络基础

OSI七层模型

物理层-0和1代表高低电压，物理网络设备规格
数据链路层-数据帧和比特流转换
网络层-地址管理和路由选择
传输层-连接节点之间的数据传输
会话层-通信管理
表示层-数据格式转换
应用层-针对应用定制

TCP/IP：定义了数据链路层以上的协议，包括网络层、传输层、应用层（会话层以上都包括）

网络层

网络层只关心起终点的整体传输，数据链路层关心每一个设备间的传输。

IP（Internet Protocol）

Q：IP为何面向无连接？

A：1.简化 2.提速 3.为上层提供自定义

IP寻址

IP地址=网络标识+主机标识

Q：如何确定网络标识位数？

A：IP分类（传统ABCD）或子网掩码来划分

路由控制

指明IP包的下一跳路由，用路由控制表保存信息。

形成方式

静态路由控制（管理员手动设置）
动态路由控制（和其他路由器交换信息自动刷新，受到“路由协议”控制）

路由聚合：多个子网掩码对外呈现同一网络地址，减少路由表条目

Q：0.0.0.0/0，IP地址/32，127.0.0.1分别是什么意思？

A：

代表默认路由，路由表中任意的地址都能和它匹配，并不是一个IP地址（IP地址应标识为0.0.0.0/32）。匹配不到的都走默认路由。在家用路由器中用来描述Internet上所有的路由从而不用存储所有路由。
代表主机路由，所有位都参与路由，代表某一个主机的唯一路由。可用于匹配家用路由器的默认路由的寻找。
代表环回地址，同一计算机内的网络通信的本地默认地址，数据不会被流向网络。

IP包的分割和重组

在发送端和路由根据每段链路的MTU进行分片，接收端进行重组。

Q：为何传输过程需要分割数据包？

A：因为每种数据链路中的MTU（Max Transfer Unit，最大传输单元）各不相同

Q：为何只在接收端而不在途中重组？

A：

无法保证分片在同一路径传输
分片可能丢失
可能之后还需要重新分片

分片机制的不足之处

路由器负荷加重
丢失某一分片整个IP包报废

路径MTU发现

先获取整个路径中数据链路的最小MTU，发送端按照这个MTU分片

工作原理：

先设置IP包禁止分片
发送并在丢弃时（说明包MTU过大）将当时可最大的MTU用ICMP不可达消息返回
设置包MTU为ICMP返回的MTU并重新循环上述步奏，直到无ICMP返回

IPv6

特点：

地址扩大，路由控制表的聚合
性能提升：不校验首部，简化首部建构
即插即用：无DHCP也可以实现自动分配IP
认证和加密：IPsec
多播和Mobile IP

DNS（Domain Name System）

将域名解析成IP。

各个域的分层有对应的域名服务器，像树一样连接分层，分别可以解析对应域名的IP。

工作原理：

查询时先向该域内的域名服务器A查询
域名服务器A从下至上找到根域名服务器
根域名服务器再从上往下找到对应的域名服务器B地址并返回给域名服务器A
A向B查询域名的IP地址并返回

ARP（Address Resolution Protocol）

通过目标IP地址定位下一个接收的网络设备MAC地址。分为请求和响应两部分。一般获取到Mac地址后会缓存一段时间。

ICMP（Internet Control Message Protocol）

主要功能

确认IP包是否成功送达
通知被废弃的具体原因

主要类型包括：目标不可达、重定向、超时、回送（Ping命令）

DHCP（Dynamic Host Configuratin Protocol）

为主机自动设置IP地址和统一管理IP地址分配。

工作原理：

发送DHCP发现包（目标地址广播，源地址未知），请求网络设置（IP地址和子网掩码等）
DHCP服务器返回可使用的网络设置
发送DHCP请求包（目标地址广播，源地址未知），通知想要应用该网络设置
DHCP服务器通知允许应用该设置

Q：为什么需要第二次通知和确认设置？

A：DHCP服务器的可分配目标地址可被管理员设置，二次确认可保证即使被重复的设置后也可以正常工作

Q：为什么DHCP服务器分配IP地址前发送ICMP、客户端应用获得的IP地址发前送ARP请求？

A：确认无返回应答从而检查IP地址是否可用，DHCP服务器发送ICMP是因为服务器少于客户端，ICMP速度更快，也不需要关心Mac地址

NAT（Network Address Translator）

用于将局域网中私有地址转换为全局IP地址的技术。

通过NAT路由器中维护一张自动生成的用来转换地址的表。

不同的内网主机可通过NAPT（Network Address Ports Translator）技术包含端口号一起转换。

IPv4和IPv6转换也可通过相关技术NAT-PT和NAPT-PT来实现

不足之处：

无法从NAT外部向内部建立连接
转换表生成和转换有开销
一旦异常需要重新启动时所有TCP连接会被重置

解决方式：IPv6或NAT穿透

IP隧道

在网络层首部后面继续追加网络层首部的通信方式

传输层

传输层通过端口号标识请求发送给哪一个应用程序的守护进程（对消息进行监听）。

标识唯一的通信的要素：源IP、目标IP、源端口号、目标端口号、协议号

UDP（User Datagram Protocol）

面向无连接的通信，不保证通信可靠，不负责丢包重发等。

主要用于高速传输和实时性要求较高的通信或广播：

包总量小（DNS等）
视频音频等多媒体通信（即时通信）
限定于LAN等特定网络
广播、多播通信

TCP（Transmission Control Protocol）

面向连接的通信，对传输、发送、通信进行控制，尽量保证通信可靠。

特点：通过序列号和确认应答（ACK）

Q：序列号作用是？

A：确认应答在途中被丢弃或者延迟到达，导致进行多次重传相同数据。序列号定义后可在确认应答中将下个应该发送的序列号带上，保证下次发送的是正确的。

Q：超时重发如何确定？

A：每次计算往返时间（RTT，Round Trip Time）和偏差（抖动值）相加并稍大一点。

Q：什么是Socket？

A：操作系统对TCP协议族封装开放的一组操作API，如Listen，Accept，Send，Write，Read，Connect，Create等。

TCP连接建立和断开

设计思想我个人总结是：一次请求对应一次应答，客户端和服务端都需要进行请求。

Q：为啥建立连接是三次握手？

A：首先这三个包分别是

客户端的请求（建立连接）
客户端请求的应答+服务端请求（建立连接）
服务端请求的应答

也就是中间那个包实际上包含两个功能。

客户端和服务端都需要请求是因为建立连接前，两端配置（比如序列号）需要协商同步。

同步信号需要一个返回确保成功，所以就有了请求的应答。
单纯一边的请求和应答并不能保证另一边也达到同步，所以就需要两边都请求。

而三个包则是满足以上两个条件的最小数字。

Q：三次握手第三次失败了怎么办？

A：这时客户端已经进入Established状态，ACK若丢失并超时，服务端尝试重新发送（默认次数为5），间隔1秒开始，每次是前一次的2倍。若还未响应，则服务端会关闭连接。之后客户端向服务端发包，服务端则用RST（Reset）包回应告知错误，防止SYN洪泛攻击（不断向服务器建立半连接而不确认使服务器不断重发ACK消耗服务器资源）。

Q：为啥断开连接是四次挥手？

A：把步骤2拆开了，因为被动方不一定已经做好了断开的准备。

Q：四次挥手第四次失败了怎么办？

A：最后一个ACK发送后，主动请求一方会进入TIME_WAIT状态，等待2MSL（Maximum Segment Lifetime）后才进入CLOSE状态。被动方可在此时间内重发ACK，来尽可能确保最后一个ACK送达。

TCP窗口

每个请求包对应一个应答会随着数量增大和往返时间增长性能降低。

所以不需要每个包对应一个应答，而是以一个更大的单位。

窗口表示某些连续的包的集合，大小为无需确认应答而可以继续发送的最大值。

窗口需要缓存整个窗口的数据避免有一部分需要重传，直到收到应答后才可清除缓存。

Q：为何需要滑动窗口？

A：滑动窗口是指收到应答后将窗口滑动到确认应答里的序列号的位置。

可以迅速使后面进入窗口范围的数据也可同时发送，提高性能。
在收到包而应答丢失的情况，收到后面的应答可以表示之前的包收到了，滑动避免重传

Q：为何需要快速重传？

A：快速重传是指连续收到三次序号一致的之前序号应答后直接重传。因为丢失某个包后，后面的包也在窗口内所以也发送出去，此时会收到多次之前丢失包序号的应答，而不需要超时等待。之所以是三次参见链接。

Q：TCP粘包是什么？

A：由于TCP是流协议，发送方后一包的头紧接着前一包的尾，粘成一包。

发送方原因:上个确认才发下个并且确认时一起发送

接收方原因：先缓存再读取，若读取速度小于接受速度

窗口大小控制

过大容易造成接收方缓存区数据溢出，丢弃后造成无意义重传。

通过TCP首部的值进行动态大小控制。

Q：为何需要发送窗口探测包？

A：接收方缓存区即将满后会暂停接收并通知发送方暂停发送（窗口大小为0）。接收方可以重新开始接受时发送一个窗口更新包通知。避免此包丢失导致通信无法重新开始，发送端时不时发送窗口探测包来获取最新的窗口大小信息。

拥塞控制

连接建立初期，突然发送大量数据容易造成网络瘫痪。

调节拥塞时发送大小的量，定义了“拥塞窗口”，让发送方窗口大小等于拥塞窗口。

设计思想：无拥塞则调大拥塞窗口，拥塞时马上减小窗口

慢启动算法：

将拥塞窗口设置为1个MSS（Maximum Segment Size，最大数据段）
开始窗口指数增长到慢启动阀值（第一次无限制）
到达慢启动阀值后改为线性增长（除第一次）
一旦发生超时则将慢启动阀值设置成当时的拥塞窗口大小的一半，并重新步骤1
一旦发生重复确认应答则将慢启动阀值设置成当时拥塞窗口的一半，之后将拥塞窗口设置为慢启动阀值大小+3MSS，并重新步骤3

应用层

WWW基本概念

WWW=信息手段和位置-URI（Uniform Resource Identifer）+信息表现形式-HTML（HyperText Markup Language）+ 信息转发-HTTP（HyperText Transfer Protocol）

HTTP

主要有八种方法，常用的是GET和POST

Q：HTTP 1.0、1.1、2.0的不同之处？

A：1.0每次请求和应答都会使用新的TCP连接，1.1允许使用一个TCP连接，大幅减少断开和建立，提升性能。

2.0使用了多路复用、二进制分帧、首部压缩等技术进一步提升性能。详见链接。

Q：GET和POST的不同之处？

A：设计的定义不同之处

GET是幂等的（不改变数据）也不改变服务器状态的，POST非幂等且可改变服务器状态
GET参数拼接在URL中，POST在HTTP请求头的Body中
GET参数长度受到url长度的限制（取决于浏览器和服务器限制而非本身）

Cookie & Session

HTTP 是一种无状态的连接，客户端每次读取时，服务器都会认为这是一次新的会话。有时候需要持久保持某些信息，这些信息就由 Cookie 和 Session 保存。

Cookie 保存在客户端上，而 Session 则保存在服务器中。

当服务端接收到 Cookie 后，根据 SessionID 来查找。如果没有，则会生成一个新的 SessionID 发送给客户端。

HTTPS

HTTP协议在安全上存在三个风险：

明文传输-数据被窃听
不验证数据完整性-数据被篡改
不验证身份-冒充发送者身份通信

针对这三个风险，HTTPS分别做了处理：

窃听-加密报文
篡改-消息校验（Hash）
伪装-证书校验（证书验证链）

最后

TCP/IP每层都设计得巧妙，实用。了解了TCP/IP之后，对网络问题的思考会更加透彻。

TCP/IP协议族边学边想

写在前面

网络基础

网络层

IP（Internet Protocol）

IP寻址

路由控制

IP包的分割和重组

路径MTU发现

IPv6

DNS（Domain Name System）

ARP（Address Resolution Protocol）

ICMP（Internet Control Message Protocol）

DHCP（Dynamic Host Configuratin Protocol）

NAT（Network Address Translator）

IP隧道

传输层

UDP（User Datagram Protocol）

TCP（Transmission Control Protocol）

TCP连接建立和断开

TCP窗口

窗口大小控制

拥塞控制

应用层

WWW基本概念

HTTP

Cookie & Session

HTTPS

最后

猜你喜欢

热点阅读