基于 k8s 调度遇到的问题
2021-04-23 本文已影响0人
鸿乃江边鸟
- pod的phase从Failed转换为了Succeeded
一开始遇到这个问题的时候很是蒙,查了一系列的源码,也没有找到原因,线下也没有复现出来,后面查看kubenrete的GitHub pr,有一系列关于phase转化的问题,比如kubelet: check for illegal phase transition,https://github.com/kubernetes/kubernetes/pull/54530,这些pr的提交都是针对1.19.x版本了,而我们现在的线上版本还是1.15.2版本。
基于线上k8s集群的升级是一个漫长的过程,所以我们可以在代码级别进行修复,比如可以维护一个超时cache,判断状态如果是失败了之后再成功的话,这可以忽略掉这个成功状态。