HTTP、TCP、UDP、Socket解读
1、导读
记得上大学时上过《计算机网络基础》专门课,当时真是单纯善良无知,觉得我以后又不搞网络这一块的东西,没必要好好学习计算机网络这们课程,只要考试通过就行了。但是工作后的我发现,不管是我们是不是做软件开发,都会多多少少接触接触到计算机网络,因为计算机网络无处不在。平时生活中我们要接触到路由器,交换机,dns,ping,修改dns等等这些基本的操作,作为软件开发者,我们要接触到tcp、udp、http、tcp连接三次握手,断开四次挥手、socket等等这些专业点的知识,真是这些专业点的知识真是书到用时方恨少啊,接下来我们就好好复习吧。
OSI是Open System Interconnection的缩写,意为开放式系统互联。国际标准化组织(ISO)制定了OSI模型,该模型定义了不同计算机互联的标准,是设计和描述计算机网络通信的基本框架。OSI模型把网络通信的工作分为7层,分别是物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。
记忆方法:记住前面的第一个字
物 数 网 传 会 表 应
这七层每一层都有自己的作用,作用如下图分解:
这里写图片描述2、Http
HTTP(HyperText Transfer Protocol、超文本传输协议)是OSI七层中应用层的协议。
协议解释:
HTTP 是基于 TCP/IP协议的应用层协议。它不涉及数据包(packet)传输,主要规定了客户端和服务器之间的通信格式,默认使用80端口。
有人说HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等),我觉这句话有问题,HTTP要是定义为协议那么http只是一种规定规则,规定了客户端的URI请求格式以及服务端数据响应格式,要说HTTP请求这个概念久比较笼统了,客户端发送一次HTTP请求,经过OSI的七层协议的组装、传输、拆分、传输等一些操作,最终可以获得我们想要的数据。
用途描述:
解决客户端和服务端的数据如何包装,包装两端最后得到的数据可以被识别。
关系描述:
TPC/IP协议是传输层协议,主要解决数据 如何在网络中传输,而HTTP是应用层协议,主要解决如何包装数据,而socket则是对TCP/IP协议的封装和应用(程序员层面上)。实际上http协议就是建立在tcp/ip协议之上的。,几乎每一种语言都有自己的Http实现,当然也有自己的Socket实现,比如Golang、Java,在自己的net包里都可以找到源代码。使用TCP协议是需要连接三次握手,断开连接三次挥手的。
HTTP 是无状态协议,它不对之前发生过的请求和响应的状态进行管理。也就是说,无法根据之前的状态进行本次的请求处理。但是使用Cookie和Session可以保存状态和识别。HTTP只能是由客户端发起,服务端是无法主动想客户端发送数据的。
2、TCP
TCP(Transmission Control Protocol,传输控制协议)是OSI七层中传输层的协议。
协议解释:
TCP(Transmission Control Protocol,传输控制协议)是基于连接的协议,也就是说,在正式收发数据前,必须和对方建立可靠的连接。TCP提供超时重发,丢弃重复数据,检验数据,流量控制等功能,保证数据能从一端传到另一端。 理想状态下,TCP连接一旦建立,在通信双方中的任何一方主动关闭连接前,TCP 连接都将被一直保持下去。断开连接时服务器和客户端均可以主动发起断开TCP连接的请求 。
安全体现在哪儿?
连接安全:三次握手 四次挥手,具体请参考:TCP详解。
数据安全:TCP提供超时重发,丢弃重复数据,检验数据,流量控制等功能,保证数据能从一端传到另一端。
用途描述:
解决网络中的数据可以安全无错的传送
关系描述:
HTTP协议是基于TCP的,由于HTTP请求是一次请求一次应答,由于请求和应答都只有一次,所以就必须保证数据的安全性,在这一次的传送中不好丢失数据,所以HTTP是要基于更加安全的TCP协议而不是UDP协议,Socket连接可以基于TCP也可以基于UDP,看具体的业务的需求了。HTTP请求使用基于TCP的Socket连接。
TCP发送的包有序号,对方收到包后要给一个反馈,如果超过一定时间还没收到反馈就自动执行超时重发,因此TCP最大的优点是可靠。一般网页(http)、邮件(SMTP)、远程连接(Telnet)、文件(FTP)传送就用TCP 。
TCP交互流程图
3、UDP
UDP (User Datagram Protocol,用户数据报协议)是OSI参考模型中无连接的传输层协议.
协议解释:
UDP用户数据报协议,是一个无连接的简单的面向数据报的运输层协议。UDP不提供可靠性,它只是把应用程序传给IP层的数据报发送出去,但是并不能保证它们能到达目的地。由于UDP在传输数据报前不用在客户和服务器之间建立一个连接,且没有超时重发等机制,故而传输速度很快。
用途描述:
解决网络中的数据可以高效的传送
关系描述:
OSI参考模型中传输协议只有TCP和UDP两种,TCP需要链接安全效率低,UDP无线连接不安全效率高,我们平时使用做多的HTTP协议基于TCP,很多语言都有HTTP请求的封装,用起来很方便,但是想使用UDP就没那么方便了,想使用UDP我们就需要自己去写一个Socket UDP了,Socket UDP不需要链接,客户端知道服务端的IP和端口号直接发送数据就可以了,Socket TCP由于需要链接所以使用的时候需要心跳机制来确保链接没有断开。
UDP一般用于多点通信和实时的数据业务,比如语音广播、视频、QQ、TFTP(简单文件传送)、SNMP(简单网络管理协议)、RTP(实时传送协议)RIP(路由信息协议,如报告股票市场,航空信息)、DNS(域名解释)。注重速度流畅。
4、Socket
名词解释:
socket是对TCP或者UDP协议的封装和实现,socket并不是协议,差不多每一种语言都实现了对TCP和UDP封装和实现的Socket代码库,方便开发程序员使用。
用途描述:
socket是对TCP或者UDP协议的封装和实现,这样我就可以基于你所使用语言的Socket来实现更多的功能,有基于Socket TCP的HTTP请求,有基于Socket TCP长连接的消息推送,也可以基于Socket TCP/UDP自定义一套自己的通信协议。
关系描述:
HTTP基于TCP,HTTP请求需要使用Socket TCP来完成。
5、一次HTTP请求的心路历程
由于一次HTTP请求会涉及到HTTP TCP Socket DNS 等等,弄清楚一次HTTP的流程大概可以知道网络请求的原理。那么我们发送一次HTTP请求到底要经历什么?
一次HTTP请求和响应要经历的几个步骤:
(1)域名解析
域名解析介意是客户端的工作,客户端只有服务端的域名(类似www.baidu.com),并不知道服务端的IP地址,需要客户端拿着域名到DNS服务器获取域名对应的IP地址。
(2) 建立TCP连接
由客户端发起,在三次握手后客户端和服务端建立TCP连接。所谓三次握手(Three-way Handshake),是指建立一个TCP连接时,需要客户端和服务器总共发送3个包。
三次握手的目的是连接服务器指定端口,建立TCP连接,并同步连接双方的序列号和确认号并交换 TCP 窗口大小信息.在 Socket 编程中,客户端执行connect()时。将触发三次握手。
首先了解一下几个标志,SYN(synchronous),同步标志,ACK (Acknowledgement),即确认标志,seq应该是Sequence Number,序列号的意思,另外还有四次握手的fin,应该是final,表示结束标志。
第一次握手:客户端发送一个TCP的SYN标志位置1的包指明客户打算连接的服务器的端口,以及初始序号X,保存在包头的序列号(Sequence Number)字段里。
第二次握手:服务器发回确认包(ACK)应答。即SYN标志位和ACK标志位均为1同时,将确认序号(Acknowledgement Number)设置为客户的序列号加1以,即X+1。
第三次握手:客户端再次发送确认包(ACK) SYN标志位为0,ACK标志位为1。并且把服务器发来ACK的序号字段+1,放在确定字段中发送给对方.并且在数据段放写序列号的+1。
(3)发起http请求发送请求报文
由客户端发起,客户端组装好请求报文,向服务端发送HTTP请求,HTTP由固定的格式,具体想看下图:
HTTP请求报文
HTTP请求报文由3部分组成(请求行+请求头+请求体),这三部分还有自己的组装格式,这里就不详细说明了。
(4)服务器端响应http请求
服务端收到客户端的HTTP请求拿到请求报文后就响应请求,就是根据请求报文处理后发送数据到客户端。服务端发送到客户端的数据叫做响应报文,由服务端组装,格式如下:
HTTP响应报文
① 报文协议及版本;
② 状态码及状态描述;
③ 响应报文头,也是由多个属性组成;
④ 响应报文体,即我们真正要的“干货”。
(5)客户端接收响应数据报文
在响应报文体里面才是我们客户端正真想要的东西,对于Android/IOS移动端来说一般都是Json数据,对于web浏览器来说一般都是HTML,客户端获得响应报文后就处理数据。
(6)关闭TCP连接
一般情况下TCP连接是由于客户端主动关闭的,关闭需要客户端主动发起四次挥手,才可以关闭TCP连接。一般情况下,一旦请求和响应完成了,就要关闭TCP连接,然后如果客户端或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,客户端可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
TCP的连接的拆除需要发送四个包,因此称为四次挥手(four-way handshake)。客户端或服务器均可主动发起挥手动作,在socket
TCP断开四次挥手编程中,任何一方执行close()操作即可产生挥手操作。
其实有个问题,为什么连接的时候是三次握手,关闭的时候却是四次挥手?
因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来 同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,” 你发的FIN报文我收到了”。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。
举例说明客户端主动发送TCP关闭请求步骤:
第一次挥手:Client发送一个FIN,表示需要关闭Client到Server的数据传送,Client进入FIN_WAIT_1状态
第二次挥手:Server收到FIN后,发送一个ACK给Client,确认序号为收到序号+1,Server进入CLOSE_WAIT状态
第三次挥手:Server发送一个FIN,用来关闭Server到Client的数据传送,Server进入LAST_ACK状态
第四次挥手:Client收到FIN后,Client进入TIME_WAIT状态,接着发送一个ACK给Server,确认序号为收到序号+1,Server进入CLOSED状态,完成四次挥手
最后图解一次HTTP请求的心路历程:
参考文章:
HTTP、TCP、UDP、Socket 知识总结
面试复习——Android工程师之网络基础
Android网络请求心路历程