HDFS概述

2017-12-24  本文已影响0人  y侃侃

HDFS优缺点

HDFS优点

高容错性

适合大数据批处理

流式文件访问

构建成本低、安全可靠

HDFS缺点

不适合低延迟数据访问

不适合大量小文件存储

不适合并发写入

不提供文件随机修改

HDFS基本架构与原理

HDFS架构图解

HDFS架构.jpg

基本概念

NameNode(Active)

NameNode(Standby)

NameNode元数据

DataNode

Block块

Client

问题:

HDFS 为什么不适合存储小文件?

  1. 元数据信息存储在NameNode内存中,内存大小有限
  2. NameNode存储Block数目有限
    • 一个block元信息消耗大约150byte内存
    • 存储1亿个block,大约需要20GB内存
    • 如果一个文件大小为10K,则1亿个文件大小仅有1TB,却消耗NameNode 20GB内存
  3. 存取大量小文件消耗大量的磁盘寻道时间

未完待续。。。

上一篇 下一篇

猜你喜欢

热点阅读