David Silver深度强化学习-1-学习笔记

2017-11-24  本文已影响134人  小白之白小明

刚开始学习强化学习,有些地方也不是很明白,但是基本都记了下来,这是第一课的学习笔记,放上来与大家分享,如果有错误希望大家指出。

原创 -- 小萌至上

1. 增强学习的本质:理解最佳的方式来制定决策

2. 强化学习框架

3. Markov 链

4. agent 的三个重要参数

5. 接下来以一张图来解释循环神经网络


疑问:若有两个或多个目标,增强学习算法怎样确定选择哪一个?
答:每一个选项,根据一些衡量标准,可以进行比较。把比较结果转换成标量反馈信号,然后就可以比较了。

6. history:选项序列→观察→采取行动→获得奖励

7. 探索与开发之间的平衡

上一篇下一篇

猜你喜欢

热点阅读