Q Learning
2019-01-12 本文已影响14人
我是传奇lz
强化学习就是用多次的尝试, 不断更新自己的经验库
Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。
注意名词:
state, action, learning rate, discount ratio.
Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。
注意名词:
state, action, learning rate, discount ratio.