(10)分布式系统的基石TCP/IP通信协议

2018-11-11  本文已影响0人  Mrsunup

网络的知识比较复杂。我曾经看过一本书叫做计算机网络自顶向下方法,很可惜自己没有耐心把它看完,只是看了前面的几个章节,涉及了应用层,运输层,以及网络层,后面的章节就没有看了,后面有机会打算看完好好梳理一番。
下面的只是简单的讲解一下用得到的知识。

第一节通信协议在分布式架构中的核心应用

1.网络领域的知识

协议:tcp、udp、multicast
io : bio, nio(netty,mina ), ano
socket
序列化和反序列化

2.一个 http 请求,在整个网络中的请求过程

当应用程序用T C P传送数据时,数据被送入协议栈中, 然后逐个通过每一层直到被当作一串比特流送入网络。其中每一层对收到的数据都要增加一些首部信息

当目的主机收到一个以太网数据帧时,数据就开始从协议 栈中由底向上升,同时去掉各层协议加上的报文首部。每 层协议盒都要去检查报文首部中的协议标 识, 以确定接收数据的上层协议。这个过程称作分用

image.png

3.为什么有了MAC层还要走IP层呢?

mac地址就好像个人的身份证号,人的身份证号和人户口 所在的城市,出生的日期有关,但是和人所在的位置没有关系,人是会移动的,知道一个人的身份证号,并不能找 到它这个人,mac地址类似,它是和设备的生产者,批次,日期之类的关联起来,知道一个设备的mac,并不能 在网络中将数据发送给它,除非它和发送方的在同一个网 络内。所以要实现机器之间的通信,还需要有ip地址的概念,ip地址表达的是当前机器在网络中的位置,类似于 城市名+道路号+门牌号的概念。通过ip层的寻址,我们能知道按何种路径在全世界任意两台Internet上的的机器间传输数据

第二节IP 协议和 TCP/UDP 协议

1.什么是协议

协议相当于两个需要通过网络通信的程序达成的一种约定, 它规定了报文的交换方式和包含的意义。比如(HTTP)为 了解决在服务器之间传递超文本对象的问题,这些超文本对象在服务器中创建和存储,并由 Web 浏览器进行可视 化,完成用户对远程内容的感知和体验

2.什么是 IP 协议?

TCP和UDP是两种最为著名的传输层协议
他们都是使用I P作为网络层协议。IP协议提供了一组数据报文服 务,每组分组报文都是由网络独立处理和分发,就像寄送 快递包裹一样,为了实现这个功能,每个IP报文必须包 含一个目的地址的字段;就像我们寄送快递都需要写明收 件人信息,但是和我们寄送快递一样,也可能会出现包裹 丢失问题,所以IP协议只是一个“尽力而为”的协议,在网络传输过程中,可能会发生报文丢失、报文顺序打乱,重复发送的情况。IP协议层之上的传输层,提供了两种可以选择的协议,TCP、UPD
两种协议都是建立在IP层所提供的服务基础上,根据应用程序的不同需求选择不同方式的传输

3.TCP 是如何做到可靠传输的?

详细的参考博客: https://www.cnblogs.com/Andya/p/7272462.html

4. 数据传输过程的流量控制和确认机制 ?

建立可靠连接以后,就开始进行数据传输了。在通信过程 中,最重要的是数据包,也就是协议传输的数据。如果数 据的传送与接收过程当中出现收方来不及接收的情况,这时就需要对发方进行控制以免数据丢失。
利用滑动窗口机制可以很方便的在TCP连接上实现对发送方的流量控制
TCP的窗口单位是字节,不是报文段,发送方的发送 窗口不能超过接收方给出的接收窗口的数值


简单解释下,发送和接受方都会维护一个数据帧的序列,这个序列被称作窗口。发送方的窗口大小由接受方确定,目的在于控制发送速度,以免接受方的缓存不够大,而导
致溢出,同时控制流量也可以避免网络拥塞。下面图中的4,5,6 号数据帧已经被发送出去,但是未收到关联的ACK,7,8,9 帧则是等待发送。可以看出发送端的窗口大小为6,这是由接受端告知的。此时如果发送端收到 4 号ACK,则窗口的左边缘向右收缩,窗口的右边缘则向右扩展,此时窗口就向前“滑动了”,即数据帧 10 也可以被发送。

第三节通信的性能问题

1.传统的bio模型

我们发现TCP响应服务器一次只能处理一个客户端请 求,当一个客户端向一个已经被其他客户端占用的服务器 发送连接请求时, 虽然在连接建立后可以向服务端发送数 据,但是在服务端处理完之前的请求之前,却不会对新的客户端做出响应,这种类型的服务器称为“迭代服务器",迭代服务器是按照顺序处理客户端请求,也就是服务端必 \须要处理完前一个请求才能对下一个客户端的请求进行响应, 而Java提供的多线程技术刚好满足这个需求,这个机制使得服务器能够方便处理多个客户 端的请求

2.TCP 协议的通信过程

对于TCP通信来说,每个 TCP Socket 的内核中都有一个 发送缓冲区和一个接收缓冲区,TCP 的全双工的工作模式及TCP 的滑动窗口就是依赖于这两个独立的 Buffer 和该 Buffer的填充状态

接收缓冲区把数据缓存到内核,若应用进程一直没有调用 Socket 的 read 方法进行读取,那么该数据会一直被缓存在接收缓冲区内。不管进程是否读取Socket,对端发来的数据都会经过内核接收并缓存到 Socket 的内核接收缓冲区。

read所要做的工作,就是把内核接收缓冲区中的数据复制到应用层用户的Buffer里
进程调用Socket的send发送数据的时候,一般情况下是将数据从应用层用户的 Buffer 里复制到 Socket 的内核发送缓冲区,然后send就会在上层返回。换句话说,send返 回时,数据不一定会被发送到对端。

Socket 的接收缓冲区被 TCP 用来缓存网络上收到的数据, 一直保存到应用进程读走为止。如果应用进程一直没有读 取,那么Buffer满了以后,出现的情况是:通知对端TCP 协议中的窗口关闭,保证TCP接收缓冲区不会移除,保证 了TCP是可靠传输的。如果对方无视窗口大小发出了超过 窗口大小的数据,那么接收方会把这些数据丢弃

3.如何使用非阻塞提高性能?

非阻塞要解决的就是I/O线程与Socket解耦的问题, 因 此,它引入了事件机制来达到解耦的目的。我们可以认为NIO底层中存在一个I/O调度线程,它不断的扫描每个 Socket的缓冲区,当发现写入缓冲区为空的时候,它会产生一个Socket可写事件,此时程序就可以把数据写入到Socket中如果一次写不完,就等待下一次的可写事 件通知;反之,当发现缓冲区里有数据的时候,它会产生 一个Socket可读事件,程序收到这个通知事件就可以从 Socket读取数据了

4.关于nio

实际上基于上面讲的传统的BIO模型,一个请求一个线程的方式,如果要涉及到上千个客户端访问时,会产生很多的问题, 比如扩展性、系统资源开销等等。所以我们需要一种方法来轮询一组客户端,来查找哪个连接需要提供服 务,这个就是我们的NIO

第四节组播协议 Multicast

对于某些信息,多个接受者都可能感兴趣的时候,那么我 们应该怎么解决呢?我们可以向每个接受者单播一个数据 副本,但是如果这样的话,效率会低;而且同样的数据发 送多次,浪费带宽。 解决方案是,我们可以把复制数据包的工作交给网络来做, 而不是由发送者负责。这样无论是多少客户端,都没问题 有两种分发类型,广播(broadcast)和多播(multicast);

上一篇 下一篇

猜你喜欢

热点阅读