2020-12-22
NameNode-发出的度量
CapacityRemaining–记录可用容量
CorruptBlocks/MissingBlocks–记录损坏/丢失的块数
VolumeFailuresTotal–记录失败的卷数
NumLiveDataNodes/NumDeadDataNodes–记录活动或死亡数据节点的计数
FilesTotal–NameNode跟踪的文件总数
Total Load–测量所有数据节点的文件访问
BlockCapacity/BlocksTotal–可分配的最大块数/按NameNode跟踪的块数
UnderReplicated Blocks–复制不足的块数
NumStaleDataNodes–过时数据节点的数量
Namenode JVM指标
ConcurrentMarkSweep计数–年老代GC的数量
ConcurrentMarkSweep time–年老代GC的运行时间,以毫秒为单位
YARN指标
集群指标–监视高级YARN应用程序的执行
应用指标——监控单个yarn应用的执行情况
节点管理器度量–在单个节点级别监视信息
集群指标
集群指标可用于查看YARN应用程序的执行情况。
unhealthyNodes–不正常的节点数
activeNodes–当前活动节点的数量
lostNodes–丢失的节点数
appsFailed–失败的应用程序数
totalMB/allocatedMB–内存总量/分配的内存量
应用程序指标
进度-应用程序执行进度表
节点管理器度量
NodeManager度量显示单个节点内资源的信息。
ContainerFailed–无法启动的容器数
如何监控yarn指标
要收集纱线的指标,可以使用http api。使用资源管理器,主机通过输入以下内容(使用qry参数指定要监视的mbean)来查询端口8088上的yarn指标
https://zookeeper.apache.org/doc/r3.4.6/zookeeperAdmin.html#sc_zkCommands