大数据技术分享玩转大数据程序员

Hadoop面试复习系列——HDFS(一)

2019-01-15  本文已影响12人  code_solve

转载自:
https://cloud.tencent.com/developer/article/1031641
https://my.oschina.net/freelili/blog/1853668

HDFS优缺点

  1. 优点
  1. 缺点

基本组成

  1. Namenode
  1. SecondaryNameNode
    它不是NameNode的备份,但可以作为NameNode的备份,当因为断电或服务器损坏的情况,可以用SecondNameNode中已合并的fsimage文件作为备份文件恢复到NameNode上,但是很有可能丢失掉在合并过程中新生成的edits信息。因此不是完全的备份。
    由于NameNode仅在启动期间合并fsimage和edits文件,因此在繁忙的群集上,edits日志文件可能会随时间变得非常大。较大编辑文件的另一个副作用是下一次重新启动NameNode需要更长时间。SecondNameNode的主要功能是帮助NameNode合并edits和fsimage文件,从而减少NameNode启动时间
  1. DataNode
    管理附加到它们运行的节点的存储,并允许用户数据存储在文件中;
    在内部,文件被分割成一个或多个块(Block),并且这些块被存储在一组DataNode中;
    负责提供来自文件系统客户端的读取和写入请求;
    执行块创建,删除;

    启动DN进程的时候会向NN汇报Block信息;
    通过向NN发送心跳保持与其联系(3秒一次),如果NN10分钟没有收到DN的心跳,则认为DN已经丢失,并且复制其上的Block到其他的DN上。

读写流程

hdfs读数据流程.jpg

后记

本文主要是记录了个人在复习过程看到的一些知识点,可能有点东拼西凑的感觉,但是作为复习来看看还是不错的。当然关于 HDFS 肯定不止这么一点东西,不过作为开发,运维相关的其实很少用到,不过还是有一些需要补充的,比如:高可用,HDFS shell相关。。。诶,其实前面有几篇文章说后续会补上,但是因为各种原因,还在那里欠着,还好没人计较,也就是自己在自娱自乐。。。哈哈

上一篇下一篇

猜你喜欢

热点阅读