想法简友广场

强化学习

2020-06-27  本文已影响0人  赵明嗯

前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕,程序的棋力就固定下来了,即使判定走棋的规则有缺漏,即使对弈无数局,程序也无法再有所提高。

而强化学习算法则不同,它可以让程序在不断对弈中提升棋力,让程序具备学习提升的能力。

上一篇 下一篇

猜你喜欢

热点阅读