hive 常见错误和解决

2020-08-08  本文已影响0人  无来无去_A

1. 如果更换Tez引擎后,执行任务卡住,可以尝试调节容量调度器的资源调度策略

$HADOOP_HOME/etc/hadoop/capacity-scheduler.xml 文件中的


  <property>
    <name>yarn.scheduler.capacity.maximum-am-resource-percent</name>
    <value>0.1</value>
    <description>
      Maximum percent of resources in the cluster which can be used to run 
      application masters i.e. controls number of concurrent running
      applications.
    </description>
</property>

改成:

<property>
    <name>yarn.scheduler.capacity.maximum-am-resource-percent</name>
    <value>1</value>
    <description>
      Maximum percent of resources in the cluster which can be used to run 
      application masters i.e. controls number of concurrent running
      applications.
    </description>
</property>

2. CombineHiveInputFormat

hive默认的输入格式处理是CombineHiveInputFormat,会对小文件进行合并。
hive (default)> set hive.input.format;
hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat
可以采用HiveInputFormat就会根据分区数输出相应的文件。
hive (default)> set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;

3.启动mysql服务时,报MySQL server PID file could not be found! 异常。

在/var/lock/subsys/mysql路径下创建hadoop102.pid,并在文件中添加内容:4396

报service mysql status MySQL is not running, but lock file (/var/lock/subsys/mysql[失败])异常。

解决方案:在/var/lib/mysql 目录下创建: -rw-rw----. 1 mysql mysql 5 12月 22 16:41 hadoop102.pid 文件,并修改权限为 777。

JVM堆内存溢出

描述:java.lang.OutOfMemoryError: Java heap space
解决:在yarn-site.xml中加入如下代码

<property>

 <name>yarn.scheduler.maximum-allocation-mb</name>

 <value>2048</value>

</property>

<property>

 <name>yarn.scheduler.minimum-allocation-mb</name>

 <value>2048</value>

</property>

<property>

 <name>yarn.nodemanager.vmem-pmem-ratio</name>

 <value>2.1</value>

</property>

<property>

 <name>mapred.child.java.opts</name>

 <value>-Xmx1024m</value>

</property>

虚拟内存限制

在yarn-site.xml中添加如下配置:

<property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
 </property>
上一篇下一篇

猜你喜欢

热点阅读