hadoop(18)--storm初体验
2018-05-26 本文已影响168人
ROCK_杰哥
原本计划接下来是spark,但是种种原因,将storm提前来分享,storm我之前也是大概会用,也没有x像hadoop和spark那样去研究他的源码,所以storm,我只能分享应用的层面,至于原理就不深究了。话不多说,开始
盗用storm官网的一张图,直观的说明storm中的元素:
![](https://img.haomeiwen.com/i11278345/c1ae2eb15251c3da.png)
水龙头的图标是:spout,数据的输入,类似MR中的inputStream
闪电的图标是:bolt,数据的处理
数据的传输是tuple:数据元组
整张图是:topology
在storm集群中有好多supervisor来分布式的运行task(bolt),如下图:
![](https://img.haomeiwen.com/i11278345/c50dda215e91793e.png)
开始搭建storm集群,准备三台机器,因为storm的nimbus需要zk集群,所以先把zk启起来,之前有zk的集群的搭建
解压
tar -zxvf apache-storm-0.9.3.tar.gz -C app/
修改配置文件
vi storm.yaml
###修改如下配置信息
########### These MUST be filled in for a storm configuration
storm.zookeeper.servers:
- "my06"
- "my07"
- "my08"
nimbus.host: "my02"
将apache-storm-0.9.3复制到my03,my04服务器上
scp -r apache-storm-0.9.3/ my03:/home/songlj/app/
scp -r apache-storm-0.9.3/ my04:/home/songlj/app/
启动
在nimbus主机上,在bin目录下
./storm nimbus
启动成功:
![](https://img.haomeiwen.com/i11278345/293a2cf9e7fb9cfc.png)
启动一个web页面的服务
./storm ui
页面如下:
![](https://img.haomeiwen.com/i11278345/7b81295356d1c7f8.png)
在supervisor主机上,在bin目录下
[songlj@my03 bin]$ ./storm supervisor
再次看web:
![](https://img.haomeiwen.com/i11278345/370e8efa9d472de3.png)
可以看出以及将新启动的supervisor加入到集群中了
在my04上再启动一个supervisor
[songlj@my04 bin]$ ./storm supervisor
再看web:
![](https://img.haomeiwen.com/i11278345/e37284a38b4190bc.png)
这样storm就搭建完成了
望指正,不吝赐教!