HULA论文阅读笔记

2018-10-01  本文已影响0人  Phlix

HULA: Scalable Load Balancing Using Programmable Data Planes

一 文章概述

这篇文章针对当前multi-rooted拓扑结构的数据中心网络(leaf-spine,Fat Tree)中带宽使用效率问题,提出了一种在可编程数据层面实现的基于拥塞感知的分布式的流量均衡策略。这个策略就是每个交换机上维护一个包含nexthop和带宽使用率的表,作为报文路由的依据,策略执行过程主要有两个部分,首先是表的更新,此时通过周期性probe报文的反向传输,来更新每一个交换机上的Path Util Table。然后是实际报文正向传输时,依据表中的nexthop来路由发送,同时将flow的粒度细分为flowlet进行路由。Probe报文可以将整个链路上的使用率信息传递到每个交换机,同时也可以检测到故障链路。
本文提出的方法有下面优点:
1.交换机不需要记录到达某个TOR交换机的整个路径的信息,而是每个交换机只保存最优路径的相邻交换机,有利于均衡策略的可扩展性
2.使用P4可编程语言实现,不需要定制相关功能硬件

二 这篇文章主要贡献

文章主要贡献主要有以下两点:
1.第一个在可编程交换机上提出了HULA,一种可扩展的数据层面负载均衡策略
2.在NS-2上实现了HULA并与最新的策略做了对比

三 回答四个问题

1 该文章解决的核心问题?前人使用的方法为什么不能解决本文提出的问题,困难在哪?本文提出的方法为什么能够有效解决这些问题?

2 该核心问题的解决带来了什么冲击?正负面都有哪些影响?

3 作者如何进行验证?数学推导还是实验测试?是否完备?如果你进行验证,你会采取什么办法?如果你的方法和本文不一样,思考作者为什么不采用你想的方法?采用你想的方法,会有什么困难?如果你用文中方法,你回遇到什么困难?

4 找本文不完善的地方,是否还有可改进的空间?

个人感觉本文不完善的地方主要有以下几点:
1.文章提出的方法,主要是两个部分,我这里概括为前后台。后台是不断发送的probe,来检测网络状态并更新交换机中的路由表,前台读取路由表,按照指导进行寻路。
这种方法给网络增加了额外流量,尽管文中作者分析了占用流量不大,得出的结论是probe发送频率为1ms时,负载只有1.28%,但是真实实验时使用的probe发送频率变成了200微秒,也就是0.2ms,那按照上面计算大概是5倍,当然作者最后说了probe频率对效果影响不明显(所以这个问题其实作者回答的还是比较好的)
2.实验部分,对于workload的介绍有,但是有一些细节就简单糊弄过去了,关键是没有引用,包括workload的出处,以及报文到达率的设置,这导致结果不是很可信
3.使用NS2模拟实现的,真机如果能实现更好

上一篇 下一篇

猜你喜欢

热点阅读