Playing Atari with Deep Reinforc

2018-03-10  本文已影响18人  海街diary

1. 简介

使用CNN从raw pixel学习Q(s, a),利用experience memory学习Q(s, a),在atari2600 games中的7款游戏上进行了测试,全部超越之前算法,并且在3款游戏上超过了人类。

2. 算法


1. DQN算法


DQN Algorithm

2. 算法细节


DQN Architecture

3.实验

4.收获

上一篇 下一篇

猜你喜欢

热点阅读