Q Learning

2019-01-12  本文已影响14人  我是传奇lz

强化学习就是用多次的尝试, 不断更新自己的经验库

Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。

注意名词:
state, action, learning rate, discount ratio.

上一篇 下一篇

猜你喜欢

热点阅读