训练延迟满足的方法 2020-05-02 本文已影响0人 ADBC_71da 开始的时候,你需要一个坚持下去的理由。这就是为什么说即时奖励是必不可少的。它们维持着你的兴奋点,而延迟奖励则在不动声色地逐渐积累。 最佳方式是利用增强法,也就是利用即时奖励来提高一种行为频度的过程。