MARL 笔记

2022-06-19  本文已影响0人  AntiGravity

16年的MARL概览: A comprehensive survey of multiagent reinforcement learning(谷歌学术)

Model-free时学习均衡:

Model-based时学习均衡:

协同(对其他agent建模)

PR2(Probabilistic Recursive Reasoning)

合作(MA共享同一个reward)

通讯 - Multiagent Bidirectionally-Coordinated Net
集中训练分布执行 - Multi-Agent Actor-Critic for Mixed Cooperative-Competitve Environments

上一篇 下一篇

猜你喜欢

热点阅读