HADOOP大数据之HDFS数据安全与隐私保护

2023-03-20  本文已影响0人  奋斗的韭菜汪

HDFS Trash垃圾桶

  1. 功能概述
  1. Trash Checkpoint
  1. HDFS Trash功能开启

删除文件跳过Trash、直接删除
有的时候,我们希望直接把文件删除,不需要再经过Trash回收站了。可以在执行删除操作的时候添加一个参数:-skipTrash.

  1. 清空Trash

HDFS Snapshot快照

快照介绍
快照作用
HDFS快照功能的实现

\color{red}{HDFS快照不是数据的简单拷贝,只做差异的记录。}
对于大多不变的数据,你所看到的数据其实是当前物理路径所指的内容,而发生变更的inode数据才会被快照额外拷贝,也就是所说的差异拷贝。
HDFS快照不会复制datanode中的块,只记录了块列表和文件大小。
HDFS快照不会对常规HDFS操作产生不利影响,修改记录按逆时针顺序进行,因此可以直接访问当前数据。通过从当前数据中减去修改来计算快照数据。

#启用快照功能:
hdfs dfsadmin -allowSnapshot/allenwoon
#禁用快照功能:
hdfs dfsadmin -disallowSnapshot/allenwoon

\color{red}{禁用的前提是该目录的所有快照已经被删除}

快照间差异比较
+创建了文件目录。
-文件目录已被删除。
M文件目录已被修改。
R文件/目录已被重命名。
删除开启快照功能的目录

HDFS 权限管理

-rwxr-xr-x(开头的-代表文件,也可以是d代表目录) 权限755


image.png

HDFS Proxy user代理用户

HDFS 透明加密

介绍
密钥
密钥库(keystore )

存储密钥(key)的叫做密钥库(keystore ) ,将HDFS与外部企业级密钥库(keystore )集成是部署透明加密的第一步。
这是因为密钥(key )管理员和HDFS管理员之间的职责分离是此功能的非常重要的方面。但是,大多数密钥库都不是为Hadoop工作负载所见的加密/解密请求速率而设计的。

KMS(密钥管理服务)

Hadoop密钥管理服务(Key Management Server,简写KMS),用作HDFS客户端与密钥库之间的代理。
KMS主要有以下几个职责∶
1.访问加密区域秘钥( EZ key )
2.生成EDEK,EDEK存储在NameNode上
3.为HDFS客户端解密EDEK

HDFS文件加密过程.jpg
\color{red}{DEK是加解密一个文件的密匙,而KMS里存储的EZ key是用来加解密所有文件的密匙(DEK)的密匙。}
KMS配置
keytool -genkey -alias 'itcast_keystore'
<configuration>
  <property>
    <name>hadoop.kms.key.provider.uri</name>
    <value>jceks://file@/${user.home]/kms.jks</value>
  </property>
  <property>
    <name>hadoop.security.keystore.java-keystore-provider.password-file</name>
    <value>kms.keystore.password</value>
  </property>
  <property>
    <name>dfs.encryption.key.provider.uri</name>
    <value>kms://http@node1:16000/kms</value>
  </property>
  <property>
    <name>hadoop.kms.authentication.type</name>
    <value>simple</value>
  </property>
</configuration>

上一篇 下一篇

猜你喜欢

热点阅读