streaming
2017-06-19 本文已影响0人
博瑜
为什么要用消息队列?比如有很多数据源在采集产生数据,如果直接把数据扔给spark streaming,可能各个产生的频率,即压力大小不同,造成spark产生问题。消息队列高吞吐,如kafka,可解决这个问题。
为什么要用消息队列?比如有很多数据源在采集产生数据,如果直接把数据扔给spark streaming,可能各个产生的频率,即压力大小不同,造成spark产生问题。消息队列高吞吐,如kafka,可解决这个问题。