2019-02-24 2019-02-24 本文已影响0人 MicroAtari 与Gábor Vásárhelyi 邮件交流,提示'make'的用法,暂未发现解决方法。 腾讯lab提出的基于视觉的追踪强化学习AD-VAT方法。 AD-VAT 谷歌提出的元奖励解决强化学习问题中的奖励问题。