关于NeurIPS 2018

2019-01-09  本文已影响43人  臻甄

会议论文概览

大会论文下载网址和最佳论文介绍:http://www.eeworld.com.cn/mp/QbitAI/a57012.jspx

论文类别梳理

引用:https://blog.csdn.net/fuxin607/article/details/84656177

亮点论文选读: http://dy.163.com/v2/article/detail/E1K8CI3B05313F6W.html

会议论文趋势

人工智能假肢挑战赛(AI for Prosthetics Challenge)

引自:http://baijiahao.baidu.com/s?id=1604230073404592834&wfr=spider&for=pc

NeurIPS 2018共8项赛事

  1. 终生机器学习中的 AutoML(AutoML for Lifelong Machine Learning
  2. 对抗性视觉挑战(Adversarial Vision Challenge
  3. 对话智能挑战赛(The Conversational Intelligence Challenge 2,ConvAI2
  4. 机器学习轨迹挑战(Tracking Machine Learning Challenge
  5. Pommerman(Pommerman
  6. 分布倾向性方面的挑战(InclusiveImages:A challenge of distributional skew, side information, and global inclusion
  7. AI 驾驶奥林匹克赛(The AI Driving Olympics)
  8. AI 在假肢中的应用(AI for prosthetics

下面关于《AI for Prosthetics Challenge》的内容转载自《雷锋网》:https://www.leiphone.com/news/201811/IKNTszt1RqDMdrIL.html

AI for Prosthetics Challenge是斯坦福大学神经生物实验室与 EPFL 联合举办了一场强化学习赛事,通过将强化学习应用到人体腿部骨骼仿真模拟模型的训练,以加快人体假肢领域的相关研究。

来自百度 NLP 团队的 Firework 一举击败全球 400 多支参赛团队,以 9980.46 的得分夺得冠军,领先第二名高达 30 多分。

7 月份启动,全球 400 多技术团队中,既有上届冠军、由 “RNN之父”Juergen Schmidhuber 创立的 NNAISENSE,也有阿里巴巴、Yandex 等巨头。

今年的比赛中,赛会组织者提供了一个人体骨骼-高仿模型,该模型是斯坦福国家医学康复研究中心研发的 Opensim 高仿模型,拥有人类腿部绝大多数真实骨骼、关节和肌肉的精细仿真。参赛者需要根据该模型中多达 100 个以上的状态,来决定模型肌肉的信号,然后控制该模型的肌体行走。

在去年的第一次挑战赛主要比谁跑得快,今年将模型从2D改为3D,还引入带有假肢的模型且假肢不可控制,且规则要求不断切换速度。使得模型控制难度大大增加。

在此次比赛中,百度的表现。
(1)首先通过上千台机器的 CPU 集群来加速模拟环境,利用 RPC 机制进行机器间通信,从而能在高性能 GPU 上进行高效的模型训练。
(2)其次,利用Target Driven Deep Deterministic Policy Gradient (Target Driven DDPG),使得模型能够应对较大空间和连续动作空间的挑战,最终也使得一个单一模型能够学习多种速度和姿态。
(3)第三,在算法层面,通过 multi-head bootstrapping,能够更高效的对巨大的解空间进行探索(Exploration),同时还将旋转不变性等各类特征处理方式,以及不断实验累计的各类 reward shaping 方法应用其中。

正是这些关键技术的综合应用,让百度能以 9980 的高分一举夺冠。据悉,早在本次比赛以前,百度已经将强化学习技术应用于信息流推荐、广告展现、搜索排序等大规模工业级场景。

另外,据说百度是首次参赛就获奖,很给国人挣脸耶。

强化学习精选文章导读

https://cloud.tencent.com/developer/news/365062

Deep Reinforcement Learning for Solving the Vehicle Routing Problem (用深度强化学习求解VRP问题)

上一篇下一篇

猜你喜欢

热点阅读