程序员Hadoop大数据,机器学习,人工智能

Hadoop教程:HDFS概述

2018-12-01  本文已影响9人  逍遥ii

Hadoop文件系统采用分布式文件系统设计开发。它在普通硬件上运行。与其他分布式系统不同,HDFS具有很高的容错性,并且使用低成本的硬件进行设计。

HDFS存储大量数据并提供更容易的访问。为了存储如此巨大的数据,文件被存储在多台机器上。这些文件以冗余的方式存储,以便在发生故障时将系统从可能的数据损失中拯救出来。HDFS还使应用程序可用于并行处理。

HDFS的特点

HDFS架构

下面给出Hadoop文件系统的架构。

hdfs_architecture.jpg

HDFS遵循主从体系结构,它具有以下元素。

Namenode

namenode是包含GNU/Linux操作系统和namenode软件的商品硬件。它是一种可以在普通硬件上运行的软件。具有namenode的系统充当主服务器,它执行以下任务:

Datanode

datanode是一种具有GNU/Linux操作系统和datanode软件的普通硬件。对于集群中的每个节点(商品硬件/系统),都将有一个datanode。这些节点管理其系统的数据存储。

Block

用户数据一般存储在HDFS文件中。文件系统中的文件将被分成一个或多个段和/或存储在单个数据节点中。这些文件段称为块。换句话说,HDFS可以读写的最小数据量称为块。默认块大小为64MB,但是可以根据需要在HDFS配置中进行更改而增加。

HDFS的目标

原文链接:https://www.tutorialspoint.com/...

上一篇 下一篇

猜你喜欢

热点阅读