想法简友广场

强化学习

2020-06-27 本文已影响0人赵明嗯

前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕，程序的棋力就固定下来了，即使判定走棋的规则有缺漏，即使对弈无数局，程序也无法再有所提高。

而强化学习算法则不同，它可以让程序在不断对弈中提升棋力，让程序具备学习提升的能力。

上一篇下一篇

猜你喜欢

热点阅读