linux编程技术架构

DDoS 攻击与防御:从原理到实践

2018-08-01  本文已影响378人  网易数帆

本文由网易云 发布。

可怕的 DDoS

出于打击报复、敲诈勒索、政治需要等各种原因,加上攻击成本越来越低、效果特别明显等趋势,DDoS 攻击已经演变成全球性的网络安全威胁。

危害

根据卡巴斯基 2016Q3 的调查报告,DDoS 攻击造成 61% 的公司无法访问其关键业务信息,38% 的公司无法访问其关键业务,33% 的受害者因此有商业合同或者合同上的损失。

趋势

总结来看,现在的 DDoS 攻击具有以下趋势:

1. 国际化

现在的 DDoS 攻击越来越国际化,而我国已经成为仅次于美国的第二大 DDoS 攻击受害国,而国内的 DDoS 攻击源海外占比也越来越高。

2. 超大规模化

由于跨网调度流量越来越方便、流量购买价格越来越低廉,现在 DDoS 攻击的流量规模越来越大。在 2014 年底,国内曾有云服务提供商遭受过高达 450Gbps 的攻击。

3. 市场化

市场化势必带来成本优势,现在各种在线 DDoS 平台、肉鸡交易渠道层出不穷,使得攻击者可以以很低的成本发起规模化攻击。按流量获取方式进行的对比可参考下表:

DDoS 攻击科普

DDoS 的攻击原理,往简单说,其实就是利用 tcp/udp 协议规律,通过占用协议栈资源或者发起大流量拥塞,达到消耗目标机器性能或者网络的目的。下面我们先简单回顾 TCP “三次握手” 与 “四次挥手” 以及 UDP 通信流程。

TCP 三次握手与四次挥手

TCP 建立连接:三次握手

1.client: syn

2.server: syn+ack

3.client: ack

TCP 断开连接:四次挥手

1.client: fin

2.server: ack

3.server: fin

4.client: ack

UDP 通信流程

根据上图可发现,udp 通信是无连接、不可靠的,数据是直接传输的,并没有协商的过程。

攻击原理与攻击危害

按照攻击对象的不同,将对攻击原理和攻击危害的分析分成 3 类,分别是攻击网络带宽资源、系统以及应用。

攻击网络带宽资源

攻击系统资源

攻击应用资源

DDoS 防护科普

攻击防护原理

从 tcp/udp 协议栈原理介绍 DDoS 防护原理:

syn flood:

可以在收到客户端第三次握手 reset 、第二次握手发送错误的 ack,等 Client 回复 Reset,结合信任机制进行判断。

ack flood:

丢弃三次 ack,让对方重连:重发 syn 建立链接,后续是 syn flood 防护原理;学习正常 ack 的源,超过阈值后,该 ack 没有在正常源列表里面就丢弃 ack 三次,让对方重连:重发 syn 建立链接,后续是 syn flood 防护。

udp flood:

不同层面的防护

按攻击流量规模分类

较小流量

小于 1000Mbps,且在服务器硬件与应用接受范围之内,并不影响业务的:

利用 iptables 或者 DDoS 防护应用实现软件层防护。

大型流量

大于 1000Mbps,但在 DDoS 清洗设备性能范围之内,且小于机房出口,可能影响相同机房的其他业务的:

利用 iptables 或者 DDoS 防护应用实现软件层防护,或者在机房出口设备直接配置黑洞等防护策略,或者同时切换域名,将对外服务 IP 修改为高负载 Proxy 集群外网 IP 或者 CDN 高仿 IP 或者公有云 DDoS 防护网关 IP,由其代理到 RealServer;或者直接接入 DDoS 清洗设备。

超大规模流量

在 DDoS 清洗设备性能范围之外,但在机房出口性能之内,可能影响相同机房的其他业务,或者大于机房出口,已经影响相同机房的所有业务或大部分业务的:

联系运营商检查分组限流配置部署情况,并观察业务恢复情况。

按攻击流量协议分类

syn/fin/ack 等 tcp 协议包

设置预警阀值和响应阀值,前者开始报警,后者开始处理,根据流量大小和影响程度调整防护策略和防护手段,逐步升级。

udp/dns query 等 udp 协议包

对于大部分游戏业务来说,都是 TCP 协议的,所以可以根据业务协议制定一份 tcp 协议白名单,如果遇到大量 udp 请求,可以不经产品确认或者延迟跟产品确认,直接在系统层面 /HPPS 或者清洗设备上丢弃 udp 包。

http flood/CC 等需要跟数据库交互的攻击

这种一般会导致数据库或者 webserver 负载很高或者连接数过高,在限流或者清洗流量后可能需要重启服务才能释放连接数,因此更倾向在系统资源能够支撑的情况下调大支持的连接数。相对来说,这种攻击防护难度较大,对防护设备性能消耗很大。

其他

icmp 包可以直接丢弃,先在机房出口以下各个层面做丢弃或者限流策略。现在这种攻击已经很少见,对业务破坏力有限。

DDoS 攻击与防护实践

DDoS 攻击的实现方式主要有如下两种:

自建 DDoS 平台

现在有开源的 DDoS 平台源代码,只要有足够机器和带宽资源,随时都能部署一套极具杀伤力的 DDoS 平台,如下图的第三种方案。

发包工具

下面提供一款常用 DDoS 客户端的发包代码,可以看到攻击方式非常丰富,ip、端口、tcp flag、包大小都是自定义的。

def func():

os.system(“./txDDoS -a “+type+” -d “+ip+” -y “+port+” -f 0x10 -s 10.10.10.10 -l 1300″)

if __name__ == “__main__”:

pool = multiprocessing.Pool(processes=int(nbproc))

for i in xrange(int(nbproc)):

pool.apply_async(func)

pool.close()

pool.join()

讲完了 DDoS 攻击的实现方式,下面介绍如何从 iptables、应用自身和高性能代理等角度去防御 DDoS 攻击。

iptables 防护

sysctl -w net.ipv4.ip_forward=1 &>/dev/null

#打开转发

sysctl -w net.ipv4.tcp_syncookies=1 &>/dev/null

#打开 syncookie (轻量级预防 DOS 攻击)

sysctl -w net.ipv4.netfilter.ip_conntrack_tcp_timeout_established=3800 &>/dev/null

#设置默认 TCP 连接最大时长为 3800 秒(此选项可以大大降低连接数)

sysctl -w net.ipv4.ip_conntrack_max=300000 &>/dev/n

#设置支持最大连接树为 30W(这个根据你的内存和 iptables 版本来,每个 connection 需要 300 多个字节)

iptables -N syn-flood

iptables -A INPUT -p tcp –syn -j syn-flood

iptables -I syn-flood -p tcp -m limit –limit 3/s –limit-burst 6 -j RETURN

iptables -A syn-flood -j REJECT

#防止SYN攻击 轻量级预防

iptables -A INPUT -i eth0 -p tcp –syn -m connlimit –connlimit-above 15 -j DROP

iptables -A INPUT -p tcp -m state –state ESTABLISHED,RELATED -j ACCEPT

#防止DOS太多连接进来,可以允许外网网卡每个IP最多15个初始连接,超过的丢弃

应用自身防护

以 Nginx 为例,限制单个 ip 请求频率。

[html]view plaincopy

http {  

limit_req_zone $binary_remote_addrzone=one:10mrate=10r/s; //触发条件,所有访问ip 限制每秒10个请求  

server {  

location ~ \.php$ {  

limit_reqzone=oneburst=5 nodelay; //执行的动作,通过zone名字对应 }  

}  

location /download/ {  

limit_conn addr 1; // 限制同一时间内1个连接,超出的连接返回503  

}  

}  

}  

高性能代理

Haproxy+keepalived

1. Haproxy 配置

前端:

frontend http

bind 10.0.0.20:80

acl anti_DDoS always_true

#白名单

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst

#标记非法用户

stick-table type ip size 20k expire 2m store gpc0

tcp-request connection track-sc1 src

tcp-request inspect-delay 5s

#拒绝非法用户建立连接

tcp-request connection reject if anti_DDoS { src_get_gpc0 gt 0 }

后端:

backend xxx.xxx.cn

mode http

option forwardfor

option httplog

balance roundrobin

cookie SERVERID insert indirect

option httpchk GET /KeepAlive.ashx HTTP/1.1\r\nHost:\ server.1card1.cn

acl anti_DDoS always_false

#白名单

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst

#存储client10秒内的会话速率

stick-table type ip size 20k expire 2m store http_req_rate(10s),bytes_out_rate(10s)

tcp-request content track-sc2 src

#十秒内会话速率超过50个则可疑

acl conn_rate_limit src_http_req_rate(server.1card1.cn) gt 80

#判断http请求中是否存在SERVERID的cookie

acl cookie_present cook(SERVERID) -m found

#标记为非法用户

acl mark_as_abuser sc1_inc_gpc0 gt 0

tcp-request content reject if anti_DDoS !whiteip conn_rate_limit mark_as_abuser

2. keepalived 配置

[html]view plaincopy

frontend http  

bind 10.0.0.20:80  

acl anti_DDoS always_true  

#白名单  

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst  

#标记非法用户  

stick-table type ip size 20k expire 2m store gpc0  

tcp-request connection track-sc1 src  

tcp-request inspect-delay 5s  

#拒绝非法用户建立连接  

tcp-request connection reject if anti_DDoS { src_get_gpc0 gt 0 }  

[html]view plaincopy

frontend http  

bind 10.0.0.20:80  

acl anti_DDoS always_true  

#白名单  

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst  

#标记非法用户  

stick-table type ip size 20k expire 2m store gpc0  

tcp-request connection track-sc1 src  

tcp-request inspect-delay 5s  

#拒绝非法用户建立连接  

tcp-request connection reject if anti_DDoS { src_get_gpc0 gt 0 }  

[html]view plaincopy

frontend http  

bind 10.0.0.20:80  

acl anti_DDoS always_true  

#白名单  

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst  

#标记非法用户  

stick-table type ip size 20k expire 2m store gpc0  

tcp-request connection track-sc1 src  

tcp-request inspect-delay 5s  

#拒绝非法用户建立连接  

tcp-request connection reject if anti_DDoS { src_get_gpc0 gt 0 }  

后端:  

backend xxx.xxx.cn  

mode http  

option forwardfor  

option httplog  

balance roundrobin  

cookie SERVERID insert indirect  

option httpchk GET /KeepAlive.ashx HTTP/1.1\r\nHost:\ server.1card1.cn  

acl anti_DDoS always_false  

#白名单  

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst  

#存储client10秒内的会话速率  

stick-table type ip size 20k expire 2m store http_req_rate(10s),bytes_out_rate(10s)  

tcp-request content track-sc2 src  

#十秒内会话速率超过50个则可疑  

acl conn_rate_limit src_http_req_rate(server.1card1.cn) gt 80  

#判断http请求中是否存在SERVERID的cookie  

acl cookie_present cook(SERVERID) -m found  

#标记为非法用户  

acl mark_as_abuser sc1_inc_gpc0 gt 0  

tcp-request content reject if anti_DDoS !whiteip conn_rate_limit mark_as_abuser  

[html]view plaincopy

frontend http  

bind 10.0.0.20:80  

acl anti_DDoS always_true  

#白名单  

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst  

#标记非法用户  

stick-table type ip size 20k expire 2m store gpc0  

tcp-request connection track-sc1 src  

tcp-request inspect-delay 5s  

#拒绝非法用户建立连接  

tcp-request connection reject if anti_DDoS { src_get_gpc0 gt 0 }  

后端:  

backend xxx.xxx.cn  

mode http  

option forwardfor  

option httplog  

balance roundrobin  

cookie SERVERID insert indirect  

option httpchk GET /KeepAlive.ashx HTTP/1.1\r\nHost:\ server.1card1.cn  

acl anti_DDoS always_false  

#白名单  

acl whiteip src -f /usr/local/haproxy/etc/whiteip.lst  

#存储client10秒内的会话速率  

stick-table type ip size 20k expire 2m store http_req_rate(10s),bytes_out_rate(10s)  

tcp-request content track-sc2 src  

#十秒内会话速率超过50个则可疑  

acl conn_rate_limit src_http_req_rate(server.1card1.cn) gt 80  

#判断http请求中是否存在SERVERID的cookie  

acl cookie_present cook(SERVERID) -m found  

#标记为非法用户  

acl mark_as_abuser sc1_inc_gpc0 gt 0  

tcp-request content reject if anti_DDoS !whiteip conn_rate_limit mark_as_abuser  

[html]view plaincopy

global_defs {  

router_id {{ server_id }}  

}  

vrrp_script chk_haproxy{  

script “/home/proxy/keepalived/{{ project }}/check_haproxy_{{ server_id }}.sh”  

interval 2  

weight -10  

}  

vrrp_instance VI_1 {  

state {{ role }}  

interface {{ interface }}  

virtual_router_id 10{{ tag }}  

priority {{ value }}  

advert_int 1  

authentication {  

auth_type PASS  

auth_pass keepalived_DDoS  

track_script {  

chk_haproxy  

}  

}  

virtual_ipaddress {  

{{ vip }}/24 dev {{ interface }} label {{ interface }}:{{ tag }}  

}  

接入 CDN 高防 IP 或公有云智能 DDoS 防御系统

由于 cdn 高防 ip 和公有云智能 DDoS 防御原理比较相近,都是利用代理或者 dns 调度的方式进行 “引流->清洗->回注” 的防御流程,因此将两者合并介绍。

CDN 高防 IP

是针对互联网服务器在遭受大流量的 DDoS 攻击后导致服务不可用的情况下,推出的付费增值服务,用户可以通过配置高防 IP,将攻击流量引流到高防 IP,确保源站的稳定可靠,通常可以提供高达几百 Gbps 的防护容量,抵御一般的 DDoS 攻击绰绰有余。

公有云智能 DDoS 防御系统

如下图,主要由以下几个角色组成:

调度系统:在 DDoS 分布式防御系统中起着智能域名解析、网络监控、流量调度等作用。

源站:开发商业务服务器。

攻击防护点:主要作用是过滤攻击流量,并将正常流量转发到源站。

后端机房:在 DDoS 分布式防御系统中会与攻击防护点配合起来,以起到超大流量的防护作用,提供双重防护的能力。

一般 CDN 或者公有云都有提供邮件、web 系统、微信公众号等形式的申请、配置流程,基本上按照下面的思路操作即可:

步骤主要有:

1. 向公有云 or CDN 厂商申请接入高防 IP 或者 DDoS 清洗系统,同时提交站点域名原解析记录

2. 修改站点域名解析记录指向公有云 or CDN 厂商提供的 ip

3. 公有云 or CDN 厂商清洗 DDoS 攻击流量,将清洗过后的正常流量回送到站点域名原解析记录的 ip

公有云 DDoS 防护服务介绍

目前大部分公有云厂商都把 DDoS 防护列入服务清单,但由于技术、资源、管理等方面的区别,存在着以下不同点:

1. 计费模式不同:有的将 DDoS 防护作为附赠服务,有的将 DDoS 防护收费,而且不同厂商的收费价格或者收费起点都不同。

2. 业务场景不同:有的公有云厂商会区分客户业务场景,比如直播、金融、游戏之类,但大部分厂商并不会区分这么细。

3. 功能丰富度不同:公有云 DDoS 防护服务提供给用户自定义的东西多少,依赖于产品成熟度。

4. 清洗能力不同:DDoS 清洗流量规模因厂家差异从几十 Gbps 到几百 Gbps,使用的防御技术成熟度和效果也各有差异,比如有的 cc 攻击防御效果立杆见影,有的则非常一般。

网易云 DDoS 防护服务介绍

网易云为用户提供 5Gbps 以下的免费异常流量清洗,超过 5Gbps 以上会根据攻击规模和资源情况确定是否继续清洗,目前暂未对此服务收费。目前网易云提供的 DDoS 防护功能有:

1. DDoS 攻击流量监控、统计与报警

2. DDoS 清洗策略用户自定义,主要有流量大小、包数以及请求数等三个维度

DDoS 攻击处理技巧荟萃

1. 发现

Rsyslog

流量监控报警

查看 /var/log/messages(freebsd),/var/log/syslog(debian),是否有被攻击的信息:

*SYN Flood**RST

limit xxx to xxx**

listen queue limit*

查看系统或者应用连接情况,特别是连接数与系统资源占用情况

netstat -antp | grep -i ‘业务端口’ | wc -l

sar -n DEV

2. 攻击类型分析

2.1 Tcpdump+wireshark

使用 tcpdump 实时抓包给 wireshark 进行解析,有了 wireshark 实现自动解析和可视化展示,处理效率非一般快。

Tcpdump -i eth0 -w test.pcap

比如通过目标端口和特殊标记识别 ssdp flood:

udp.dstport == 1900

(udp contains “HTTP/1.1”) and (udp contains 0a:53:54:3a)

2.2 高效的 DDoS 攻击探测与分析工具 FastNetMon

也可以使用 FastNetMon 进行实时流量探测和分析,直接在命令行展示结果,但是如果攻击流量很大,多半是派不上用场了。

2.3 攻击溯源

Linux 服务器上开启 uRPF 反向路径转发协议,可以有效识别虚假源 ip,将虚假源 ip 流量抛弃。另外,使用 unicast 稀释攻击流量,因为 unicast 的特点是源-目的=1:n,但消息只会发往离源最近的节点,所以可以把攻击引导到某个节点,确保其他节点业务可用。

企业级 DDoS 清洗系统架构探讨

自研

使用镜像/分光(采集)+sflow/netflow(分析)+DDoS 清洗设备(清洗)三位一体的架构是目前很多企业采用的防 D 架构,但是一般只适用于有自己机房或者在 IDC 业务规模比较大的企业。如下图所示,在 IDC 或者自建机房出口下通过镜像/分光采集流量,集中到异常流量监测系统中进行分析,一旦发现异常流量,则与 DDoS 清洗设备进行联动,下发清洗规则和路由规则进行清洗。

商用

现在很多网络设备厂商/安全厂商都有成体系的流量采集、异常流量检测和清洗产品,比如绿盟、华为、思科、Arbo 等,相关产品在业界都很出名且各有市场,愿意通过采购构建企业 DDoS 防护体系的企业可以了解、购买相应的产品,这里不多赘述。

混合

对于大型企业而言,由于网络环境和业务规模比较大,DDoS 清洗架构不会采用单一的商用或者自研方案,而是混合了自研、商用以及公有云等多种方案,具体实现可参考上文介绍。

至此,DDoS 攻击与防御:从原理到实践第一部分介绍完毕,欢迎大家多提真知灼见。

参考资料

走近科学:揭秘在线 DDoS 攻击平台(上)

http://www.freebuf.com/special/107119.html

走近科学:揭秘在线 DDoS 攻击平台(下)

http://www.freebuf.com/news/107916.html

卡巴斯基 DDoS 调查报告

https://securelist.com/analysis/quarterly-malware-reports/76464/kaspersky-DDoS-intelligence-report-for-q3-2016/

DDoS 攻击报道

http://tech.huanqiu.com/cloud/2014-12/5288347.html

高效的 DDoS 攻击探测与分析工具 FastNetMon

http://www.freebuf.com/news/67204.html

腾讯宙斯盾系统构建之路

https://security.tencent.com/index.php/blog/msg/62

鲍旭华等《破坏之王:DDoS 攻击与防范深度剖析》

网易云安全(易盾)的DDoS 高防服务提供 1T 超大防护带宽,用户可以通过配置高防 IP,将攻击流量引流到高防 IP,抵御超大流量 DDoS 攻击

本文已由作者林伟壕授权网易云社区发布(未经许可请勿转载),原文链接:DDoS 攻击与防御:从原理到实践(上)

上一篇 下一篇

猜你喜欢

热点阅读