100天持续行动—Day24

2018-11-17  本文已影响0人  Richard_DL

11.15
把 reinforcement learning 的简易教程的代码敲了2遍,理解了程序中每一步在做什么。然后开始看Temporal-Difference Methods.

上一篇 下一篇

猜你喜欢

热点阅读