数据库服务器Tcp_Timestamp和recycle引发的大量

2019-11-21 本文已影响0人 mysia

0 - 现象

若同时开启timestamp和recycle参数，会由于引发per-host的PAWS机制，导致连接成功率降低。

产生问题：

tcp_timestamps的本质是记录数据包的发送时间。
基本步骤如下：

RTT（Round Trip Time）由三部分组成：链路的传播时间（propagation delay）、末端系统的处理时间、路由器缓存中的排队和处理时间（queuing delay）

简单来说就是我发送一个数据包，然后对端回一个ack，那么当我接到ack之后，就能计算出从我发送出包到接到过了多久，这个时间就是RTT，所以RTT的变化在一定程度上反应了网络的拥塞程度。

RTO就是tcp在发送一个数据包之后，会启动一个重传定时器，而RTO就是这个定时器的重传时间。在通俗的讲就是，我一开始预先算个定时器时间，如果你回复了ack那正好，如果没有回复给我ack，然后RTO定时器的时间又到了，那么我就重传。

产生问题：

若没有timestamp就会采用SKB->when的方式计算RTT，基本步骤如下：

这时会存在一个缺陷，如当进行如下操作：

会产生10字节的TCP header开销

表示开启TCP连接中TIME-WAIT sockets的快速回收，默认为0，表示关闭。对客户端和服务器同时起作用，开启后在 3.5*RTO 内回收，RTO 200ms~ 120s 具体时间视网络状况。

在高带宽下，TCP序列号可能在较短的时间内就被重复使用(recycle/wrapped)，就可能导致同一条TCP流在短时间内出现序号一样的两个合法的数据包及其确认包！

PAWS机制就是为了应对这一现象设计的，这种机制要求所有来个同一个host IP的TCP数据包的

timestamp值是递增的。当收到一个timestamp值，小于服务端记录的对应值后，则会认为这是一个过期的数据包，然后会将其丢弃。