Ubuntu 下使用 docker 和 CDH搭建 Hadoop
2017-01-05 本文已影响1748人
heamon7
-
安装 Docker 环境
Ubuntu 14.04 下安装 Docker 环境请参考 Ubuntu 快速安装 Docker -
创建Hadoop的Docker容器
Reference:
Multi-node Clusters with Cloudera QuickStart for Docker
docker 安装 cloudera quickstart
http://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html
4.28
MySQL on Docker
$ docker run --name mysql-dev -p 3306:3306 -e MYSQL_ROOT_PASSWORD=buptnic -d mysql:5.6
导出 Hive 数据到 MySQL:
CREATE DATABASE `zsb_log` CHARACTER SET utf8 COLLATE utf8_general_ci;
sqoop export --connect "jdbc:mysql://10.3.181.3:3306/zsb_log" --username root --password buptnic --table ip_geo_statistics --export-dir /user/hive/warehouse/zsb_log.db/ip_geo_statistics --num-mappers 3 --input-fields-terminated-by '\001' --input-lines-terminated-by '\n'
sqoop export --connect "jdbc:mysql://10.3.181.3:3306/zsb_log?useUnicode=true&characterEncoding=utf8" --username root --password buptnic --table ip_geo_statistics --export-dir /user/hive/warehouse/zsb_log.db/ip_geo_statistics --num-mappers 3 --input-fields-terminated-by '\001' --input-lines-terminated-by '\n'
phpadmin on docker
docker run --name phpadmin-dev -d -e PMA_HOST=10.3.181.3 -p 8080:80 phpmyadmin/phpmyadmin
这个系列是 Python 相关知识 https://www.coursera.org/specializations/python ,主要涉及 Python 语法基础,Python 获取 Web 数据(爬虫等),Python 连接数据库大数据的是这个 https://www.coursera.org/specializations/big-data主要涉及 CDH 版的 Hadoop 相关使用(MapReduce,Hive,Pig,Spark)
docker 安装 cloudera quickstart
http://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html