hive安装及配置
2023-04-17 本文已影响0人
Nenezsnp
仅以此篇记录虚拟机linux安装hive的过程,以做日后学习之用
本篇是为了安装hive,目前已完成全部的安装包括hadoop+jdk、zookeeper、mysql,此篇为最后一篇
hive安装
1、上传apache-hive-3.1.3-bin.tar.gz包至/opt
2、解压到/usr/local/wzy_server下
tar -xvf apache-hive-3.1.3-bin.tar -C /usr/local/wzy_server
解压hive
3、重命名为hive
cd /usr/local/wzy_server
mv apache-hive-3.1.3-bin hive
重命名hive
4、配置环境变量
vi /etc/profile
#增加以下内容:
# HIVE_HOME
export HIVE_HOME=/usr/local/wzy_server/hive
export PATH=$HIVE_HOME/bin:$PATH
esc :wq保存
5、使文件生效
source /etc/profile
编辑环境变量
配置HIVE文件
1、配置hive-env.sh
cd $HIVE_HOME/conf
进入hive访问路径conf文件夹下
1)复制
# 复制命令
cp hive-env.sh.template hive-env.sh
复制hive-env.sh
2)编辑
# 编辑
vi hive-env.sh
编辑hive-env.sh
3)增加内容
# Set HADOOP_HOME to point to a specific hadoop install directory
HADOOP_HOME=/usr/local/wzy_server/hadoop-3.3.4
# Hive Configuration Directory can be controlled by:
export HIVE_CONF_DIR=/usr/local/wzy_server/hive/conf
2、配置hive-site.xml
1)新建一个文件hive-site.xml
touch hive-site.xml
新建hive-site.xml
2)编辑
vi hive-site.xml
编辑hive-site.xml
3)添加内容
<configuration>
<property>
<!-- 查询数据时 显示出列的名字 -->
<name>hive.cli.print.header</name>
<value>true</value>
</property>
<property>
<!-- 在命令行中显示当前所使用的数据库 -->
<name>hive.cli.print.current.db</name>
<value>true</value>
</property>
<property>
<!-- 默认数据仓库存储的位置,该位置为HDFS上的路径 -->
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
<!-- 8.x -->
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&useSSL=false</value>
</property>
<!-- 8.x -->
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>1234</value>
</property>
<!-- hiveserver2服务的端口号以及绑定的主机名 -->
<property>
<name>hive.server2.thrift.port</name>
<value>10000</value>
</property>
<property>
<name>hive.server2.thrift.bind.host</name>
<value>master</value>
</property>
<property>
<name>hive.server2.long.polling.timeout</name>
<value>5000</value>
<description>Time in milliseconds that HiveServer2 will wait, before responding to asynchronous calls that use long polling</description>
</property>
</configuration>
3、配置日志
# 创建日志目录
cd $HIVE_HOME
mkdir log
# 设置日志配置
cd ./conf
cp hive-log4j2.properties.template hive-log4j2.properties
vi hive-log4j2.properties
# 修改以下内容:
property.hive.log.dir = /usr/local/wzy_server/hive/log
新建log文件夹
配置log文件夹地址
4、修改默认配置文件
cp hive-default.xml.template hive-default.xml
5、上传MySQL连接jar包
#上传mysql-connector-java-5.1.27.jar 至 /usr/local/wzy_server/hive/lib目录中
cp /opt/mysql-connector-java-5.1.27.jar /usr/local/wzy_server/hive/lib/
6、重启mysql
service mysqld restart
初始化HIVE
schematool -dbType mysql -initSchema
初始化
7.进入hive
需要提前启动hadoop、zookeeper
hive
hive启动
show databases;
show databases;
8.启动 hiveserver2
hive --service hiveserver2
9.启动 beeline
beeline -u jdbc:hive2://master:10000 -n root
参考链接:
1.(此参考链接已在hadoop文章中体现) https://blog.csdn.net/qq_44226094/article/details/121962669
2.(此链接需要看评论,你就懂了)https://blog.csdn.net/weixin_51202216/article/details/120823380
3.补充知识metastore https://blog.csdn.net/qq_45688530/article/details/121848452