Ubuntu 下使用 docker 和 CDH搭建 Hadoop

2017-01-05  本文已影响1748人  heamon7
  1. 安装 Docker 环境
    Ubuntu 14.04 下安装 Docker 环境请参考 Ubuntu 快速安装 Docker

  2. 创建Hadoop的Docker容器

Reference:

  1. Ubuntu Installation Guide

Multi-node Clusters with Cloudera QuickStart for Docker

docker 安装 cloudera quickstart
http://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html

4.28

MySQL on Docker

$ docker run --name mysql-dev -p 3306:3306 -e MYSQL_ROOT_PASSWORD=buptnic -d mysql:5.6

导出 Hive 数据到 MySQL:

CREATE DATABASE `zsb_log` CHARACTER SET utf8 COLLATE utf8_general_ci;


sqoop export --connect "jdbc:mysql://10.3.181.3:3306/zsb_log" --username root --password buptnic --table ip_geo_statistics --export-dir /user/hive/warehouse/zsb_log.db/ip_geo_statistics --num-mappers 3 --input-fields-terminated-by '\001' --input-lines-terminated-by '\n' 



sqoop export --connect "jdbc:mysql://10.3.181.3:3306/zsb_log?useUnicode=true&characterEncoding=utf8" --username root --password buptnic --table ip_geo_statistics --export-dir /user/hive/warehouse/zsb_log.db/ip_geo_statistics --num-mappers 3 --input-fields-terminated-by '\001' --input-lines-terminated-by '\n' 

phpadmin on docker

docker run --name phpadmin-dev -d -e PMA_HOST=10.3.181.3 -p 8080:80 phpmyadmin/phpmyadmin

这个系列是 Python 相关知识 https://www.coursera.org/specializations/python ,主要涉及 Python 语法基础,Python 获取 Web 数据(爬虫等),Python 连接数据库大数据的是这个 https://www.coursera.org/specializations/big-data主要涉及 CDH 版的 Hadoop 相关使用(MapReduce,Hive,Pig,Spark)

docker 安装 cloudera quickstart
http://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html

上一篇下一篇

猜你喜欢

热点阅读