2020-02-24 强化学习
2020-02-24 本文已影响0人
金日成
1.马尔可夫决策过程
2.免模型的强化学习model free
a.Monte carlo「First visit」,「Ever visit」
b.TD-learning
C.Q-learning
D.Sarsa
E.DQN algorithm
1.马尔可夫决策过程
2.免模型的强化学习model free
a.Monte carlo「First visit」,「Ever visit」
b.TD-learning
C.Q-learning
D.Sarsa
E.DQN algorithm