什么是 Multiagent Q Learning

2020-04-02 本文已影响0人不会停的蜗牛

multiagent 是指同时有多个 agent 更新 value 和 Q 函数，主要的算法有：q learning， friend and foe q leaning，correlated q learning，在每个训练步骤，学习器会考虑多个 agent 的联合 states，actions，reward，来更新 q 值，其中会用到函数 f 选择价值函数。

下图是单一 agent 和多个 agent 的对比图，可以很直观地看到区别：

热点阅读

早餐里见世界
谏言：全国的扫黑反腐

08-22浅谈对“天津爆炸事故”的看法和感想
07-04元芳你怎么看下一句
07-03陪伴是最长情的告白下一句
01-21你知道fighting是什么意思？告诉你fighting的意思
06-23深度好文：生命的意义不单是幸福
06-20深度好文：人最怕深交后的陌生

什么是 Multiagent Q Learning

猜你喜欢

热点阅读