强化学习
2020-06-27 本文已影响0人
赵明嗯
前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕,程序的棋力就固定下来了,即使判定走棋的规则有缺漏,即使对弈无数局,程序也无法再有所提高。
而强化学习算法则不同,它可以让程序在不断对弈中提升棋力,让程序具备学习提升的能力。
前文出现的人机对战五子棋是采用基于规则的算法进行走棋。规则设定完毕,程序的棋力就固定下来了,即使判定走棋的规则有缺漏,即使对弈无数局,程序也无法再有所提高。
而强化学习算法则不同,它可以让程序在不断对弈中提升棋力,让程序具备学习提升的能力。