2021-05-10 一天又过去了

2021-05-10  本文已影响0人  听风的声音_b8cf

今天自己把Q-Learning的流程用matlab写了一遍,又用python写了一遍。写完后感觉代码也没有几行。但是matlab中的reinforcement learning toolbox中的代码却是那么复杂!里面用到的一些优化策略,自己真的是不了解。皮毛和深度的差别啊!自己安慰自己,自己每天都有学习新知识,那就是不辜负时光!

上一篇下一篇

猜你喜欢

热点阅读