增强学习Reinforcement Learning

StarCraft II:A New Challenge for

2018-01-17  本文已影响79人  海街diary

简介:这篇文章主要介绍了增强学习在星际争霸中的应用。作者简单介绍了星际争霸,以及提供的接口pysc。

原理:在星际争霸中存在多个agent,和一个uncompleted mini-map,需要在最后破坏掉对方的所有建筑,目标可以是最后的win(1)、tile(0)、lose(-1),也可以是游戏提供的分数(score)。通过屏幕截图,我们可以利用DL来提取、获取信息,得到situation,然后根据RL算法,做出action的选择,通过pysc接口进行agent的控制。由于真实游戏太复杂,作者提供了几个mini-game,在这些mini-game中也可以应用RL。

在实现过程中,作者提出了Atari-net和FullyConv和FullyConvLSTM三种框架,并运用Asynchronous Advantage Actor Critic方法,进行了真实游戏和mini-game 的对比(这些方法和结果对比还没看懂 - - !)

上一篇 下一篇

猜你喜欢

热点阅读