云计算already

一文学会容器云平台稳定性建设

2022-08-29  本文已影响0人  sknfie

一、概述

本文从实战的角度,复盘故障并开始云平台稳定性建设。

二、k8s控制面稳定性建设

1.稳定性改进措施

从监控告警体系、部署架构和业务整改等三个维度进行k8s控制面稳定性建设:


k8s控制面稳定性建设

2.apiserver稳定性建设

apiserver稳定性建设

3.etcd稳定性建设

etcd稳定性建设

4.kube-controller-manager稳定性建设

controller稳定性建设

三、宿主机巡检

1.宿主机故障

2.热点宿主机

2.监控告警维护

从故障发现、故障上报、故障自愈、故障自动化处理、故障手动处理等步骤逐级上升处理:

3.热点宿主机治理

4.异常pod巡检

四、网络可观测性建设

1.监控维度

监控维度

2.宿主机网络精细化监控

宿主机网络精细化监控

3.同宿主机实例聚合监控

同宿主机实例聚合监控

五、镜像管理

1.现状

现状

2.ceph性能提升

ceph性能提升

3.镜像分层

镜像分层
上一篇 下一篇

猜你喜欢

热点阅读