网络协议之TCP/IP
计算机网络的结构是分层的,每层都有各种协议来规范,关于互联网的分层以及每一层的协议介绍请参考我的另外一篇文章:现代巴别塔(互联网)是怎么建成的。而TCP/IP是其中最重要的一个协议族,除了包括位于传输层的TCP/UDP协议和网络接口层的IP/ARP协议之外,默认还包括位于应用层的http/Ftp/Telnet等协议。
TCP
1. TCP协议的定义
TCP(Transmission Control Protocol)协议是构成整个互联网传输协议的重要一部分,它位于网络分层结构的传输层。
其实,传输层的协议有两种:TCP和UDP。但是UDP不能保证数据被准确无误的发送到目的地,而TCP要求目标主机在收到数据后发回一个确认,如果发送方在一定时间内未收到确认信息,则会重新发送数据包。因此,UDP发送速度更快,TCP发送更可靠。
2. TCP协议实现的步骤
2.1 知识储备
标志位(SYN flag):
-
紧急指针(URGENT POINTER):立即处理不必排队
-
确认(ACKNOWLEDGEMENT):ACK=1表示确认数据包成功接收
-
推送PUSH:关于优先级
-
复位(RST)标志
-
同步标志(SYNCHRONISATION FLAG):SYN=1表示申请建立连接
-
FIN 标志:拆除上一个标志SYN建立的连接
ack(acknowledge) number:只有ACK=1时才有效,建立连接后发送报文的ACK必须为1.
seq(sequence) number
MSL(Maximum segment lifetime):报文最大生存时间
2.2 三次握手
三次握手即客户端与服务端传送的三个数据包
- 第一次握手:

客户端发送数据包到服务端,其中将标志位SYN置为1,发送顺序号seq=x。然后客户端进入SYN_SENT状态,等待服务器确认
- 第二次握手:

服务端接收到数据包,根据标志位SYN=1知道客户端请求建立连接。服务端发送确认数据包到客户端,其中将标志位ACK,SYN置为1,ack=x+1,seq=y。然后服务器进入到SYN_RCVD状态。
- 第三次握手:

客户端接收到来自服务端的确认后,检查ack是否为x+1,如果正确,则发送数据包到服务端,其中ack=y+1。服务端检查ACK是否是y+1,如果正确,则连接建立成功,客户端和服务端同时进入ESTABLISHED状态,完成三次握手。
2.3 数据传输
客户端序列号seq=x+1,ACK=Y+1,发送数据包给服务端,服务端收到后,ACK=y+2
2.4 四次挥手
- 第一次挥手:
客户端发送一个数据包到服务器,其中标志位FIN=1,初始化序列号seq=u,同时客户端进入FIN_WAIT_1状态。
- 第二次挥手:
服务端发回一个数据包给客户器,其中ACK=1,ack number=u+1,序列号seq=v。然后客户端进入FIN_WAIT_2状态,服务端进入CLOSE_WAIT状态。
- 第三次挥手:
服务端断开与客户端的链接,发回客户端一个数据包,其中FIN=1,ACK=1,seq=w,和ack number=u+1.服务器进入LAST_ACK状态
- 第四次挥手:
客户端发送数据包到服务端,其中ACK=1,ack number=w+1.客户端进入TIME_WAIT状态,等待2MAL进入close状态,服务器也进入close状态。
Socket连接
socket是对TCP/IP协议的封装成的接口,方便程序员更方便的使用TCP/IP协议。不过需要注意的是socket可以基于TCP也可以基于UDP。socket连接的建立至少需要一对套接字:Client socket和Server socket
1. 连接过程
-
服务端监听
-
客户端请求
-
连接确认
特点
基于TCP的socket连接可能是长连接可能是短连接,长连接需要定时发送心跳包来维持。
HTTP协议
超文本传送协议(Hypertext Transfer Protocol )建立在TCP/IP基础上,他的特点是客户端发送的每次请求都需要服务端的响应,请求结束后主动释放连接,所以是一种短连接。
http的请求/响应步骤
1. 客户端连接到web服务器
客户端与web服务器的HTTP端口(默认80)建立一个TCP套接字连接
2. 客户端发送HTTP请求
通过TCP套接字,客户端向web服务器发送一个请求报文。请求报文由请求行(request line),请求头(header),空行和请求数据四部分组成。如下图

2.1 请求行
如图所示,请求行由三个字段构成:请求方法,URL,HTTP协议版本。
其中HTTP协议的请求方法有GET、POST、HEAD、PUT、DELETE、OPTIONS、TRACE、CONNECT
2.2 请求头
请求头由key:value的形式构成。比如
Content-Type:请求体/响应体的类型
User-Agent:产生请求的浏览器类型。
Accept:客户端可识别的内容类型列表。
Host:请求的主机名,允许多个域名同处一个IP地址,即虚拟主机。
2.3 空行
发送回车符和换行符,通知服务器以下不再有请求头
2.4 请求数据
请求数据不在GET方法中使用,而是在POST方法中使用
3. 服务器接收请求并返回HTTP响应
HTTP响应报文也由四个部分组成,分别是:状态行、消息报头、空行和响应正文.如下图

4. 释放连接
若connection 模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接;若connection 模式为keepalive,则该连接会保持一段时间,在该时间内可以继续接收请求
5. 客户端解析HTML内容
http与https的区别
HTTP传输的数据都是明文的,未加密的,https通过SSL(Secure Sockets Layer)协议对数据进行加密。此处不再展开
End。