TCP/IP协议族边学边想
写在前面
最近读了《图解TCP/IP》这本书,重新理解了大二囫囵吞枣,应付考试而学习的“计算机网络”和“TCP/IP”这两门课中一些未理解的知识,和疑惑的问题。
网络基础
OSI七层模型
- 物理层-0和1代表高低电压,物理网络设备规格
- 数据链路层-数据帧和比特流转换
- 网络层-地址管理和路由选择
- 传输层-连接节点之间的数据传输
- 会话层-通信管理
- 表示层-数据格式转换
- 应用层-针对应用定制
TCP/IP:定义了数据链路层以上的协议,包括网络层、传输层、应用层(会话层以上都包括)
网络层
网络层只关心起终点的整体传输,数据链路层关心每一个设备间的传输。
IP(Internet Protocol)
Q:IP为何面向无连接?
A:1.简化 2.提速 3.为上层提供自定义
IP寻址
IP地址=网络标识+主机标识
Q:如何确定网络标识位数?
A:IP分类(传统ABCD)或子网掩码来划分
路由控制
指明IP包的下一跳路由,用路由控制表保存信息。
形成方式
- 静态路由控制(管理员手动设置)
- 动态路由控制(和其他路由器交换信息自动刷新,受到“路由协议”控制)
路由聚合:多个子网掩码对外呈现同一网络地址,减少路由表条目
Q:0.0.0.0/0,IP地址/32,127.0.0.1分别是什么意思?
A:
- 代表默认路由,路由表中任意的地址都能和它匹配,并不是一个IP地址(IP地址应标识为0.0.0.0/32)。匹配不到的都走默认路由。在家用路由器中用来描述Internet上所有的路由从而不用存储所有路由。
- 代表主机路由,所有位都参与路由,代表某一个主机的唯一路由。可用于匹配家用路由器的默认路由的寻找。
- 代表环回地址,同一计算机内的网络通信的本地默认地址,数据不会被流向网络。
IP包的分割和重组
在发送端和路由根据每段链路的MTU进行分片,接收端进行重组。
Q:为何传输过程需要分割数据包?
A:因为每种数据链路中的MTU(Max Transfer Unit,最大传输单元)各不相同
Q:为何只在接收端而不在途中重组?
A:
- 无法保证分片在同一路径传输
- 分片可能丢失
- 可能之后还需要重新分片
分片机制的不足之处
- 路由器负荷加重
- 丢失某一分片整个IP包报废
路径MTU发现
先获取整个路径中数据链路的最小MTU,发送端按照这个MTU分片
工作原理:
- 先设置IP包禁止分片
- 发送并在丢弃时(说明包MTU过大)将当时可最大的MTU用ICMP不可达消息返回
- 设置包MTU为ICMP返回的MTU并重新循环上述步奏,直到无ICMP返回
IPv6
特点:
- 地址扩大,路由控制表的聚合
- 性能提升:不校验首部,简化首部建构
- 即插即用:无DHCP也可以实现自动分配IP
- 认证和加密:IPsec
- 多播和Mobile IP
DNS(Domain Name System)
将域名解析成IP。
各个域的分层有对应的域名服务器,像树一样连接分层,分别可以解析对应域名的IP。
工作原理:
- 查询时先向该域内的域名服务器A查询
- 域名服务器A从下至上找到根域名服务器
- 根域名服务器再从上往下找到对应的域名服务器B地址并返回给域名服务器A
- A向B查询域名的IP地址并返回
ARP(Address Resolution Protocol)
通过目标IP地址定位下一个接收的网络设备MAC地址。分为请求和响应两部分。一般获取到Mac地址后会缓存一段时间。
ICMP(Internet Control Message Protocol)
主要功能
- 确认IP包是否成功送达
- 通知被废弃的具体原因
主要类型包括:目标不可达、重定向、超时、回送(Ping命令)
DHCP(Dynamic Host Configuratin Protocol)
为主机自动设置IP地址和统一管理IP地址分配。
工作原理:
- 发送DHCP发现包(目标地址广播,源地址未知),请求网络设置(IP地址和子网掩码等)
- DHCP服务器返回可使用的网络设置
- 发送DHCP请求包(目标地址广播,源地址未知),通知想要应用该网络设置
- DHCP服务器通知允许应用该设置
Q:为什么需要第二次通知和确认设置?
A:DHCP服务器的可分配目标地址可被管理员设置,二次确认可保证即使被重复的设置后也可以正常工作
Q:为什么DHCP服务器分配IP地址前发送ICMP、客户端应用获得的IP地址发前送ARP请求?
A:确认无返回应答从而检查IP地址是否可用,DHCP服务器发送ICMP是因为服务器少于客户端,ICMP速度更快,也不需要关心Mac地址
NAT(Network Address Translator)
用于将局域网中私有地址转换为全局IP地址的技术。
通过NAT路由器中维护一张自动生成的用来转换地址的表。
不同的内网主机可通过NAPT(Network Address Ports Translator)技术包含端口号一起转换。
IPv4和IPv6转换也可通过相关技术NAT-PT和NAPT-PT来实现
不足之处:
- 无法从NAT外部向内部建立连接
- 转换表生成和转换有开销
- 一旦异常需要重新启动时所有TCP连接会被重置
解决方式:IPv6或NAT穿透
IP隧道
在网络层首部后面继续追加网络层首部的通信方式
传输层
传输层通过端口号标识请求发送给哪一个应用程序的守护进程(对消息进行监听)。
标识唯一的通信的要素:源IP、目标IP、源端口号、目标端口号、协议号
UDP(User Datagram Protocol)
面向无连接的通信,不保证通信可靠,不负责丢包重发等。
主要用于高速传输和实时性要求较高的通信或广播:
- 包总量小(DNS等)
- 视频音频等多媒体通信(即时通信)
- 限定于LAN等特定网络
- 广播、多播通信
TCP(Transmission Control Protocol)
面向连接的通信,对传输、发送、通信进行控制,尽量保证通信可靠。
特点:通过序列号和确认应答(ACK)
Q:序列号作用是?
A:确认应答在途中被丢弃或者延迟到达,导致进行多次重传相同数据。序列号定义后可在确认应答中将下个应该发送的序列号带上,保证下次发送的是正确的。
Q:超时重发如何确定?
A:每次计算往返时间(RTT,Round Trip Time)和偏差(抖动值)相加并稍大一点。
Q:什么是Socket?
A:操作系统对TCP协议族封装开放的一组操作API,如Listen,Accept,Send,Write,Read,Connect,Create等。
TCP连接建立和断开
设计思想我个人总结是:一次请求对应一次应答,客户端和服务端都需要进行请求。
Q:为啥建立连接是三次握手?
A:首先这三个包分别是
- 客户端的请求(建立连接)
- 客户端请求的应答+服务端请求 (建立连接)
- 服务端请求的应答
也就是中间那个包实际上包含两个功能。
客户端和服务端都需要请求是因为建立连接前,两端配置(比如序列号)需要协商同步。
- 同步信号需要一个返回确保成功,所以就有了请求的应答。
- 单纯一边的请求和应答并不能保证另一边也达到同步,所以就需要两边都请求。
而三个包则是满足以上两个条件的最小数字。
Q:三次握手第三次失败了怎么办?
A:这时客户端已经进入Established状态,ACK若丢失并超时,服务端尝试重新发送(默认次数为5),间隔1秒开始,每次是前一次的2倍。若还未响应,则服务端会关闭连接。之后客户端向服务端发包,服务端则用RST(Reset)包回应告知错误,防止SYN洪泛攻击(不断向服务器建立半连接而不确认使服务器不断重发ACK消耗服务器资源)。
Q:为啥断开连接是四次挥手?
A:把步骤2拆开了,因为被动方不一定已经做好了断开的准备。
Q:四次挥手第四次失败了怎么办?
A:最后一个ACK发送后,主动请求一方会进入TIME_WAIT状态,等待2MSL(Maximum Segment Lifetime)后才进入CLOSE状态。被动方可在此时间内重发ACK,来尽可能确保最后一个ACK送达。
TCP窗口
每个请求包对应一个应答会随着数量增大和往返时间增长性能降低。
所以不需要每个包对应一个应答,而是以一个更大的单位。
窗口表示某些连续的包的集合,大小为无需确认应答而可以继续发送的最大值。
窗口需要缓存整个窗口的数据避免有一部分需要重传,直到收到应答后才可清除缓存。
Q:为何需要滑动窗口?
A:滑动窗口是指收到应答后将窗口滑动到确认应答里的序列号的位置。
- 可以迅速使后面进入窗口范围的数据也可同时发送,提高性能。
- 在收到包而应答丢失的情况,收到后面的应答可以表示之前的包收到了,滑动避免重传
Q:为何需要快速重传?
A:快速重传是指连续收到三次序号一致的之前序号应答后直接重传。因为丢失某个包后,后面的包也在窗口内所以也发送出去,此时会收到多次之前丢失包序号的应答,而不需要超时等待。之所以是三次参见链接。
Q:TCP粘包是什么?
A:由于TCP是流协议,发送方后一包的头紧接着前一包的尾,粘成一包。
发送方原因:上个确认才发下个并且确认时一起发送
接收方原因:先缓存再读取,若读取速度小于接受速度
窗口大小控制
过大容易造成接收方缓存区数据溢出,丢弃后造成无意义重传。
通过TCP首部的值进行动态大小控制。
Q:为何需要发送窗口探测包?
A:接收方缓存区即将满后会暂停接收并通知发送方暂停发送(窗口大小为0)。接收方可以重新开始接受时发送一个窗口更新包通知。避免此包丢失导致通信无法重新开始,发送端时不时发送窗口探测包来获取最新的窗口大小信息。
拥塞控制
连接建立初期,突然发送大量数据容易造成网络瘫痪。
调节拥塞时发送大小的量,定义了“拥塞窗口”,让发送方窗口大小等于拥塞窗口。
设计思想:无拥塞则调大拥塞窗口,拥塞时马上减小窗口
慢启动算法:
- 将拥塞窗口设置为1个MSS(Maximum Segment Size,最大数据段)
- 开始窗口指数增长到慢启动阀值(第一次无限制)
- 到达慢启动阀值后改为线性增长(除第一次)
- 一旦发生超时则将慢启动阀值设置成当时的拥塞窗口大小的一半,并重新步骤1
- 一旦发生重复确认应答则将慢启动阀值设置成当时拥塞窗口的一半,之后将拥塞窗口设置为慢启动阀值大小+3MSS,并重新步骤3
应用层
WWW基本概念
WWW=信息手段和位置-URI(Uniform Resource Identifer)+信息表现形式-HTML(HyperText Markup Language)+ 信息转发-HTTP(HyperText Transfer Protocol)
HTTP
主要有八种方法,常用的是GET和POST
Q:HTTP 1.0、1.1、2.0的不同之处?
A:1.0每次请求和应答都会使用新的TCP连接,1.1允许使用一个TCP连接,大幅减少断开和建立,提升性能。
2.0使用了多路复用、二进制分帧、首部压缩等技术进一步提升性能。详见链接。
Q:GET和POST的不同之处?
A:设计的定义不同之处
- GET是幂等的(不改变数据)也不改变服务器状态的,POST非幂等且可改变服务器状态
- GET参数拼接在URL中,POST在HTTP请求头的Body中
- GET参数长度受到url长度的限制(取决于浏览器和服务器限制而非本身)
Cookie & Session
HTTP 是一种无状态的连接,客户端每次读取时,服务器都会认为这是一次新的会话。有时候需要持久保持某些信息,这些信息就由 Cookie 和 Session 保存。
Cookie 保存在客户端上,而 Session 则保存在服务器中。
当服务端接收到 Cookie 后,根据 SessionID 来查找。如果没有,则会生成一个新的 SessionID 发送给客户端。
HTTPS
HTTP协议在安全上存在三个风险:
- 明文传输-数据被窃听
- 不验证数据完整性-数据被篡改
- 不验证身份-冒充发送者身份通信
针对这三个风险,HTTPS分别做了处理:
- 窃听-加密报文
- 篡改-消息校验(Hash)
- 伪装-证书校验(证书验证链)
最后
TCP/IP每层都设计得巧妙,实用。了解了TCP/IP之后,对网络问题的思考会更加透彻。