分布式文件系统 HDFS

2021-12-21  本文已影响0人  you的日常

HDFS 简介

什么是 HDFS?

image

HDFS 全称 Hadoop Distributed File System,Hadoop 分布式文件系统。它是 2003 年 10 月 Google 发表的 GFS(Google File System)论文的开源实现,之后成为 Apache Hadoop 的核心子项目,用于解决海量数据存储问题。它在开源大数据技术体系中,地位无可替代,到现在为止,依然是主流的大数据存储选型。

GFS 论文地址: http://nil.csail.mit.edu/6.824/2017/papers/gfs.pdf

设计目标

HDFS 的设计目标有:

HDFS 的优缺点

优点

HDFS 最大的优点在于它支持海量数据存储(典型文件大小 GB~TB,百万以上文件数量,PB 以上数据规模),是大数据存储的经典选型。

上一篇 下一篇

猜你喜欢

热点阅读