AI2017_有关AlphaGo Zero的内幕

2018-01-08 本文已影响20人良宵听雨

1/3

2016年横空出世的AlphaGo彻底粉碎了普遍存在的“围棋领域机器无法战败人类最强手”的执念，但是毕竟李世石还是赢了一局，不少人对于人类翻盘大逆转还是抱有希望，紧接着Master通过60连胜诸多顶尖围棋高手彻底浇灭了这种期待。

2017年AlphaGo Zero作为AlphaGo二代做了进一步的技术升级，把AlphaGo一代虐得体无完肤，这时候人类已经没有资格上场对局了。2017年底AlphaGo的棋类游戏通用版本Alpha Zero问世，不仅仅围棋，对于国际象棋、日本将棋等其他棋类游戏，Alpha Zero也以压倒性优势战胜包括AlphaGo Zero在内的目前最强的AI程序。

2/3

AlphaGo Zero从技术手段上和AlphaGo相比并未有本质上的改进，主体仍然是MCST蒙特卡洛搜索树加神经网络的结构以及深度增强学习训练方法，但是技术实现上简单优雅很多。主要的改动包含两处：一处是将AlphaGo的两个预测网络（策略网络和价值网络）合并成一个网络，但是同时产生两类所需的输出；第二处是网络结构从CNN结构升级为ResNet。

3/3

虽说如此，AlphaGo Zero给人带来的触动和启发丝毫不比AlphaGo少，主要原因是AlphaGo Zero完全放弃了从人类棋局来进行下棋经验的学习，直接从一张白纸开始通过自我对弈的方式进行学习，并仅仅通过三天的自我学习便获得了远超人类千年积累的围棋经验。

素材来源：人工智能头条。

AI2017_有关AlphaGo Zero的内幕

猜你喜欢

热点阅读