GPU On K8s

2021-10-17  本文已影响0人  Secret_Sun

最近机缘巧合、莫名其妙,玩起了 GPU 的东西。算法同学要求又高,裸跑 GPU 是不可能的,要 K8s。被逼只好开始研究这个高级东西,断断续续前前后后历时半年的样子,掌握了个大概。今天整理下下。

Device Plugin

K8s 的设计真的太美了,插件化 + Informer 简直就是完美的设计。只要兼容 API 接口协议,理论上均可接入 K8s 中(不推荐大家因为轮子而去造轮子,社区 & 默认的组件已经可以覆盖很多公司的需求了)

Kubernetes provides a device plugin framework that you can use to advertise system hardware resources to the Kubelet. Instead of customizing the code for Kubernetes itself, vendors can implement a device plugin that you deploy either manually or as a DaemonSet .

device plugin 确实可以帮助插入很多设备,但是对于 GPU 来说仅仅是是 K8s 可以识别设备,并完成如下两件核心的事情

如上显而易见的优势明显,再没有复杂的驱动安装,资源浪费等问题,全部基于 K8s 的管理 & 调度统一解决了这些问题,算法工程师 or 算法科学家 跑 Job 即可。

Device Plugin 是否完美无缺

是否需要 GPU 切分使用、简单性能提升

工具推荐

参考文献

写在最后

上一篇 下一篇

猜你喜欢

热点阅读