百度PaddlePaddle常规赛NLP赛道火热开启

2018-10-01  本文已影响0人  PaddleWeekly

作为人工智能时代的基础,深度学习一直是人工智能最热门、企业投入最多的研究领域之一,百度PaddlePaddle深度学习框架应运而生,这是国内唯一一家拥有自主知识产权的开源深度学习框架。在此框架中,汇聚了更多的AI科学家、架构师、AI爱好者,设置常规赛,提供丰富的真实数据,多样的算法赛题,显示百度对深度学习框架战略地位的重视,让AI爱好者能够得到更多真实场景的练习机会和更多PaddlePaddle的实际训练经验,这势必推动PaddlePaddle更广泛、更深入地用于人工智能研发及落地应用。

目前已推出2个赛题,从最常见的文档提取归纳总结出发,涉及汽车以及中文阅读领域,无论是从赛事的设计理念,还是对技术能力的把握,此次常规赛都将对PaddlePaddle的推广和使用产生深远的影响。之后PaddlePaddle将会持续推出更多主题的常规赛,让我们拭目以待。

赛题一:汽车大师问答模型赛

【赛题简介】

汽车大师是一款通过在线咨询问答为车主解决用车问题的APP,致力于做车主身边靠谱的用车顾问,车主通过汽车大师用语音、文字或图片发布汽车问题,系统为其匹配专业技师提供及时有效的咨询服务。由于平台用户基数众多,重复回答和持续时间长的多轮问询花去汽修技师大量时间,也使用户获取解决方案的时间变长,对双方来说都存在资源浪费的情况。为了节省更多人工时间,提高用户获取回答和解决方案的效率,要求选手们使用汽车大师提供的11万条技师与用户的多轮对话与诊断建议报告数据建立模型,从而可基于对话文本、用户问题、车型与车系,输出包含摘要与推断的报告文本,考验模型的归纳总结与推断能力。

汽车大师比赛样例项目: http://aistudio.baidu.com/aistudio/#/projectdetail/27113

汽车大师比赛数据集: http://aistudio.baidu.com/aistudio/#/datasetdetail/1407

赛题二:NLP智能问答赛

【赛题简介】

BROAD中包含着迄今为止规模最大的中文公开领域阅读理解数据集,DuReader。该数据集基于真实应用需求,所有问题均来源于百度搜索用户的真实问题,文档来自全网真实采样的网页文档和百度知道 UGC 文档,答案基于问题与文档由人工撰写生成。数据集标注了问题类型、实体和观点等丰富信息,弥补了现有主流数据集对于观点类问题覆盖不足的问题。要求选手们依据BROAD开放数据集中全球最大中文阅读理解数据集建立基于文本与问题,输出正确答案的模型,考验模型的归纳总结与改述能力。

机器阅读理解样例项目:

http://aistudio.baidu.com/aistudio/#/projectdetail/27131

数据集: http://aistudio.baidu.com/aistudio/#/datasetdetail/1410

赛程及奖项设置

比赛从2018年9月28日开始,直到赛题下线。常规赛不设初赛复赛,以当月每位参赛选手提交的最优成绩排名。这期间选手每天可提交5次作品,当评分优于baseline Model成绩,则认定挑战成功,即可停止提交。选手可同时参加多场比赛。

具体详情请看官网:http://aistudio.baidu.com/aistudio/#/competition

(点击AI Studio官网-比赛-比赛列表-选取要参加的比赛)

PaddlePaddle期待与全球AI爱好者们一起打造世界顶级深度学习框架,共同推动AI技术的进步。

上一篇下一篇

猜你喜欢

热点阅读