2022-12-04
2022-12-03 本文已影响0人
朗月斋主
尽管在训练人工智能系统模仿人类语言方面取得了很大进展,但构建使用语言在交互式环境中有意与人类交流的代理仍然是一个重大挑战。西塞罗是第一个在外交中实现人类水平表现的人工智能代理,这是一款涉及合作和竞争的策略游戏,强调七名玩家之间的自然语言谈判和战术协调。西塞罗将语言模型与规划和强化学习算法相结合,从对话中推断玩家的信念和意图,并产生对话以追求其计划。在一个匿名在线外交联盟的40场比赛中,西塞罗的平均得分是人类玩家的两倍多,并且在玩过不止一款游戏的参与者中排名前10%。
-- 通过将语言模型与战略推理相结合,在外交游戏中发挥人类水平
Meta Fundamental AI Research Diplomacy Team (FAIR)† et al. “Human-level play in the game of Diplomacy by combining language models with strategic reasoning.” Science (New York, N.Y.), eade9097. 22 Nov. 2022, doi:10.1126/science.ade9097