2019语言与智能技术竞赛成绩出炉,三大任务系统效果平均提升30
让机器像人一样理解语言和交流,是自然语言处理技术(NLP)的重要目标。近期,在2019语言与智能技术竞赛中,机器阅读理解、知识驱动对话和信息抽取三大核心任务的系统效果取得显著提升,平均成绩提高30%!
由中国计算机学会(CCF)、中国中文信息学会(CIPS)和百度公司联合举办的“2019语言与智能技术竞赛”于近日公布榜单成绩,深思考人工智能机器人科技(北京)有限公司获得了机器阅读理解任务的第一名,深圳追一科技有限公司夺得了知识驱动任务榜首,信息抽取任务的桂冠则由复旦大学摘得。竞赛将在8月24日举办的第四届“语言与智能高峰论坛”举办技术交流和颁奖,更多大赛及榜单信息可登录2019语言与智能技术竞赛官网http://lic2019.ccf.org.cn查看。
本次竞赛分设机器阅读理解、知识驱动对话和信息抽取三个核心任务,共有近2500支队伍报名参赛。其中六成队伍来自海内外高校和科研机构,包括近百所211大学和多家科研机构。另外四成队伍来自三百多家企业,包含微软、华为、中国移动、中国工商银行、海尔等等知名企业。数量众多、不同背景的参赛队伍,也给竞赛的问题解决带来了多样的视角和思维的碰撞。
加速语言智能发展,百度助推人工智能技术加快落地
在AI技术逐渐与更多生活场景深度融合的时代,如何让机器像人一样具备语言能力,可以理解和运用自然语言,并基于知识学习持续进化,是人工智能目前需要解决的核心问题之一。此次竞赛任务覆盖的机器阅读理解、知识驱动对话、信息抽取三大核心技术,均为语言理解和交互领域的重要前沿课题。
本次比赛共收到六千多份结果提交,三大任务的系统效果平均提升30%。其中,阅读理解任务ROUGE-L提升34.88%(47.08->63.50),BLEU-4提升29.97%(46.01->59.80);知识驱动对话任务Score提升36.55%(0.922->1.259);信息抽取任务F1提升21.51%(73.41%->89.20%)。参赛者在完成挑战的同时,其成果也将有力地推动智能搜索、智能推荐、智能交互等人工智能应用迈入新台阶。
作为本次竞赛承办方,百度不仅为选手开放了大规模标注的中文数据集,还为选手提供了全面的技术及资源支持。针对三大任务,百度分别开发了先进的、基于深度学习框架的开源基线模型,帮助选手快速进入开发工作,大幅提升参赛效率。在基线版本上,百度为竞赛三大任务均提供了飞桨(PaddlePaddle)版基线模型。百度飞桨(PaddlePaddle)是中国首个开源深度学习平台,依托百度业务场景的长期锤炼,拥有最全面的官方支持的工业级应用模型,涵盖自然语言处理、计算机视觉、推荐引擎等多个领域,并开放多个领先的预训练中文模型,以及多个在国际范围内取得竞赛冠军的算法模型。此外,百度AI Studio平台还为参赛选手免费提供GPU集群计算资源。AI Studio是百度深度学习一站式开发平台,集成了飞桨(PaddlePaddle)开发环境、数据集和免费算力资源。参赛者借助AI Studio的平台资源和预置飞桨(PaddlePaddle)基线,可快速进入模型训练阶段,达到事半功倍的效果。
积极推动技术交流,百度助力产业智能化升级
在人工智能发展的大背景下,百度在人工智能领域的探索有目共睹。作为行业的领军者,此次百度协同学界与业界一起举办语言与智能技术竞赛,打磨人工智能关键技术,挖掘人工智能方面的人才,为推动行业发展,输送新鲜血液助力。除了本次比赛,百度还积极开展百度之星大赛、中国高校计算机大赛人工智能创意赛、百度-西安交大大数据竞赛等众多人工智能技术竞赛,积极推进我国人工智能学术和产业的发展。
百度始终秉承开放生态的理念,积极开放其核心能力,助力互联网、金融、医疗、零售、出行、服务等行业,推动中国产业智能化升级。未来,百度也将继续推动人工智能技术在全社会的普及、深入挖掘人工智能技术的应用价值,为人工智能领域持续培养和输出人才,为中国的产业智能化进程做出重要贡献。