大数据安全大数据运维及安全@IT·互联网

Step by Step 实现基于 Cloudera 5.8.2

2017-02-17  本文已影响519人  大数据之心

为了节省浏览器前的你的宝贵时间,这篇文集适合以下的读者:

最近从阿里跳槽出来,去了一家互联网创业公司,第一件事情就是折腾一个具备安全特性的大数据平台。历史原因,公司已经部署了免费版本的Cloudera私有云平台,主要用于基于Impala的类SQL数据查询,以及基于Kafka+Flume的数据准实时同步。经过调研,惊喜发现Cloudera的免费组件已经包含了以下几大利器,完全可以满足现在的需求,遂决定进行实现:

当然,还有HDFS层面的透明静态数据加密,这块因为担心调研不够充分,没有着急上。之前的经验告诉我,如果没有做好备份,最坏的情况可能会因为断电导致的多台物理机坏盘,造成核心加解密代码无法读取,最终丢失数据。
最近,所有的部署都完成了,业务也开始迁移到新的安全平台,看到国内外没有任何一篇文章可以完整描述基于Cloudera的企业级安全大数据平台的整个部署和调试过程,所以记录下来,予人玫瑰,手有余香。
本文集主要包括9篇文章,读者可以按需查阅,因为部分参数配置是前后相关的,所以建议从头开始连续阅读:

本人是安全小白,欢迎各位安全大牛指导和拍砖。

上一篇 下一篇

猜你喜欢

热点阅读