大数据技术

大数据技术之HDFS(六)

2021-04-16  本文已影响0人  pauls

DataNode数据节点

6.1 DataNode 工作 机制

工作机制

DN 向 NN 汇报当前解读信息的时间间隔,默认 6 小时;

<property> 
    <name>dfs.blockreport.intervalMsec</name>   
    <value>21600000</value> 
    <description>Determines block reporting interval in milliseconds.</description> 
</property>

DN 扫描自己节点块信息列表的时间,默认 6 小时

<property> 
    <name>dfs.datanode.directoryscan.interval</name>   
    <value>21600s</value> 
    <description>Interval in seconds for Datanode to scan data directories and reconcile the difference between blocks in memory and on the disk. Support multiple time unit suffix(case insensitive), as described in dfs.heartbeat.interval. </description> 
</property>

6.2 数据 完整性

思考:如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号(1)和绿灯信号(0),但是存储该数据的磁盘坏了,一直显示是绿灯,是否很危险?同理 DataNode 节点上的数据损坏了,却没有发现,是否也很危险,那么如何解决呢?

如下是 DataNode 节点保证数据完整性的方法。

校验

6.3 掉线时限参数设置

DataNode掉线时限参数设置

需要注意的是 hdfs-site.xml 配置文件中的 heartbeat.recheck.interval 的单位为毫秒,dfs.heartbeat.interval 的单位为秒。

<property> 
      <name>dfs.namenode.heartbeat.recheck-interval</name>   
      <value>300000</value> 
</property> 
<property> 
      <name>dfs.heartbeat.interval</name> 
      <value>3</value> 
</property>
上一篇下一篇

猜你喜欢

热点阅读