[Microsoft/AI-System]微软AI系统Lab6,
2021-07-18 本文已影响0人
sagfugetabf
2021-07-16
Lecture 7: Scheduling and resource management system
Lecture8: Inference systems
Lab6:Scheduling and resource management system
实验6确实是做不了,卑微的环境暂时凑不齐三台有GPU的服务器
Lab7 :Distributed training
实验7,其实和前面的horovod实验差不多,最大的区别是需要再装一个gloo库来测试结果,需要反复的安装horovod库来测试不同的通讯库对训练速度的影响