数据科学日记

2020-02-24 强化学习

2020-02-24  本文已影响0人  金日成

1.马尔可夫决策过程

2.免模型的强化学习model free

a.Monte carlo「First visit」,「Ever visit」

b.TD-learning

C.Q-learning 

D.Sarsa

E.DQN algorithm

上一篇下一篇

猜你喜欢

热点阅读