强化学习
2019-01-09 本文已影响1人
大黑跟小白的日常
什么是强化学习
1、动态系统或环境中,利用“试错”的方式进行自我学习,通过奖赏指导行为。
2、动态选择过程中,预演所有选择的一切结果,根据结果的奖赏,选择最优的结果。利用分布式计算(学习)。
典型例子:围棋对战,4:1战胜人类
什么是强化学习
1、动态系统或环境中,利用“试错”的方式进行自我学习,通过奖赏指导行为。
2、动态选择过程中,预演所有选择的一切结果,根据结果的奖赏,选择最优的结果。利用分布式计算(学习)。
典型例子:围棋对战,4:1战胜人类