百度PaddlePaddle常规赛NLP赛道火热开启

做为人工智能时代的基础,深度学习一直是人工智能最热门、企业投入最多的研究领域之一,百度PaddlePaddle深度学习框架应运而生,这是国内惟一一家拥有自主知识产权的开源深度学习框架。在此框架中,汇聚了更多的AI科学家、架构师、AI爱好者,设置常规赛,提供丰富的真实数据,多样的算法赛题,显示百度对深度学习框架战略地位的重视,让AI爱好者可以获得更多真实场景的练习机会和更多PaddlePaddle的实际训练经验,这势必推进PaddlePaddle更普遍、更深刻地用于人工智能研发及落地应用。算法

目前已推出2个赛题,从最多见的文档提取概括总结出发,涉及汽车以及中文阅读领域,不管是从赛事的设计理念,仍是对技术能力的把握,这次常规赛都将对PaddlePaddle的推广和使用产生深远的影响。以后PaddlePaddle将会持续推出更多主题的常规赛,让咱们拭目以待。架构

赛题一:汽车大师问答模型赛框架

【赛题简介】学习

汽车大师是一款经过在线咨询问答为车主解决用车问题的APP,致力于作车主身边靠谱的用车顾问,车主经过汽车大师用语音、文字或图片发布汽车问题,系统为其匹配专业技师提供及时有效的咨询服务。因为平台用户基数众多,重复回答和持续时间长的多轮问询花去汽修技师大量时间,也使用户获取解决方案的时间变长,对双方来讲都存在资源浪费的状况。为了节省更多人工时间,提升用户获取回答和解决方案的效率,要求选手们使用汽车大师提供的11万条技师与用户的多轮对话与诊断建议报告数据创建模型,从而可基于对话文本、用户问题、车型与车系,输出包含摘要与推断的报告文本,考验模型的概括总结与推断能力。人工智能

汽车大师比赛样例项目: http://aistudio.baidu.com/aistudio/#/projectdetail/27113
汽车大师比赛数据集: http://aistudio.baidu.com/aistudio/#/datasetdetail/1407spa

赛题二:NLP智能问答赛设计

【赛题简介】图片

BROAD中包含着迄今为止规模最大的中文公开领域阅读理解数据集,DuReader。该数据集基于真实应用需求,全部问题均来源于百度搜索用户的真实问题,文档来自全网真实采样的网页文档和百度知道 UGC 文档,答案基于问题与文档由人工撰写生成。数据集标注了问题类型、实体和观点等丰富信息,弥补了现有主流数据集对于观点类问题覆盖不足的问题。要求选手们依据BROAD开放数据集中全球最大中文阅读理解数据集创建基于文本与问题,输出正确答案的模型,考验模型的概括总结与改述能力。资源

机器阅读理解样例项目:文档

http://aistudio.baidu.com/aistudio/#/projectdetail/27131
数据集: http://aistudio.baidu.com/aistudio/#/datasetdetail/1410

赛程及奖项设置

比赛从2018年9月28日开始,直到赛题下线。常规赛不设初赛复赛,以当月每位参赛选手提交的最优成绩排名。这期间选手天天可提交5次做品,当评分优于baseline Model成绩,则认定挑战成功,便可中止提交。选手可同时参加多场比赛。

具体详情请看官网:http://aistudio.baidu.com/aistudio/#/competition

(点击AI Studio官网-比赛-比赛列表-选取要参加的比赛)

PaddlePaddle期待与全球AI爱好者们一块儿打造世界顶级深度学习框架,共同推进AI技术的进步。

相关文章
相关标签/搜索