百度AI闪耀ACL2020:展示多项前沿技术、举办首届机器同传研讨会

欢迎关注【百度NLP】官方公众号,及时获取更多业界前沿技术!


近日,第58届国际计算语言学协会年会ACL 2020(The Association for Computational Linguistics)于线上开启。此次会议,百度共有11篇论文被录用,覆盖天然语言处理众多前沿研究方向;百度联合谷歌、Facebook、清华大学等全球顶尖机构,共同举办首届同声传译研讨会;在线上展台主题技术TALK环节,百度还就开放域人机对话技术、ERNIE核心技术等业内关注的话题展开分享,展示了中国企业在天然语言处理及人工智能领域的技术创新与落地实践能力。算法

ACL成立于1962年,是天然语言处理领域影响力最大、最具活力的国际学术组织之一。自成立之日起,致力于推进计算语言学及天然语言处理相关研究的发展和国际学术交流。百度的天然语言处理技术,在技术创新及应用上始终保持领先,一直被视为天然语言处理研究界的“第一梯队”,这次在ACL 2020大会中的亮眼表现,正是源于百度在技术领域的长期积累。编程

百度11篇论文被收录,扎实AI技术彰显国际影响力网络

ACL2020共收录百度11篇论文架构

除了在国际AI学界的影响力外,ACL不管是审稿规范仍是审稿质量,都是当今AI领域国际顶级会议中公认的翘楚。框架

本届大会百度共有11篇论文被收录,覆盖了人机对话系统、情感分析/预训练表示学习、NLP文本生成与摘要、机器翻译/同声翻译、知识推理、AI辅助临床诊断等诸多天然语言处理界的前沿研究方向,提出了包括端到端开放域生成模型PLATO、面向开放域对话的基于图谱的对话管理机制、情感知识加强的语言模型预训练方法、基于图表示的多文档生成式摘要方法GraphSum等诸多新框架、新算法、新数据,不只极大提高了相关领域的研究水平,也将推进人机交互、机器翻译、智慧医疗等场景的技术落地应用。学习

这次ACL 2020的审稿周期,从去年12月一直持续到今年4月,相比往年几乎增长了一倍。会议投稿数量为3088篇,共有77篇论文被接收,包括571篇长论文和208篇短论文,接收率仅为25.2%。百度11篇论文被收录的成绩,不只意味着研究成果获得了国际学术界的承认,也证实了其研究自己在实验严谨性、思路创新性等方面的实力。优化

领衔举办ACL 2020首届机器同传研讨会,百度技术领先性获得公认ui

同声传译以其高效的信息传递方式,普遍应用于国际会议、商务会谈、新闻发布、法律诉讼等多种跨语言交流场景。机器同传结合了机器翻译(Machine Translation)、语音识别(Automatic Speech Recognition)和语音合成(Text-To-Speech)等人工智能技术,已经成为重要的前沿研究领域。目前,机器同传还须要攻克高鲁棒性、高翻译质量、低延时的相关问题。人工智能

本次会议中,百度联合国内外顶尖企业和高校共同举办全球首届同声传译研讨会,聚集包括机器翻译、语音处理和人类口译领域的研究和从业人员,共同就机器同传架构、翻译模型、数据资源等问题展开研讨。spa

百度技术委员会主席、百度天然语言处理首席科学家吴华受邀作线上报告

研讨会有多场高质量主题演讲,百度技术委员会主席、百度天然语言处理首席科学家吴华等国内外多名专家就机器同传研究现状、面临挑战以及将来发展进行探讨,加深了机器同传与口译两个领域之间的交流,极大地推进了机器同传技术发展以及机器和人工同传的协同合做。

在本次研讨会同期举办的国际首届同传评测比赛中,百度行业首发业内最大规模面向真实场景的中英同传数据,涵盖信息技术、经济、文化、生物、艺术等多个领域。同时,基于百度深度学习平台飞桨的一站式AI开发实训平台百度大脑AI Studio,百度为参赛选手提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速建立和部署模型。

展示多个技术亮点,百度线上展台主题技术TALK引关注

在本次大会的线上展台主题技术TALK环节,百度也展示出多个亮点,体现出百度领先的技术创新与落地实践能力,围绕ERNIE核心技术、开放域人机对话技术、智慧医疗、生物医药等业内关注的话题,百度献上了精彩的演讲。

在展台主题技术TALK环节,百度研究人员作出主题为《ERNIE的技术原理、平台与应用》的分享。百度提出了知识加强的语义表示模型ERNIE及持续学习语义理解框架ERNIE 2.0,在16个中英文任务上超越国际最好效果,取得了SOTA的效果。去年12月,ERNIE在国际权威的通用语言理解评估基准GLUE上首次突破90大关,超越人类三个点,取得全球第一。今年3月,在全球最大规模的国际语义评测SemEval上得到5项世界冠军。

近期,百度又相继发布了面向生成的预训练技术ERNIE-Gen和知识加强的视觉-语言预训练模型ERNIE-ViL。ERNIE-Gen首次提出基于多流机制生成完整语义片断,在5个生成类任务上取得了SOTA效果。ERNIE-ViL首次将场景图知识融入多模态预训练, 刷新了5项多模态任务纪录,并登顶权威榜单VCR。在刚刚举行的世界人工智能大会上,百度文心(ERNIE)知识加强语义理解技术与平台得到了大会最高荣誉奖项“卓越人工智能引领者”(SAIL)奖。

在《基于意图图谱的开放域对话生成框架》分享中,百度研究人员介绍到,为了提高多轮对话下的总体对话质量,提出基于意图图谱的对话生成框架,在该框架中引入显式的对话管理机制,以加强对多轮对话流的控制能力。在公开数据集上的实验结果代表,以上模型或系统在主题连贯性、对话目标引导成功率等关键多轮效果指标上显著超越基线模型。

同时,百度借助此次展台技术Talk发布了业界首个基于隐变量的大规模对话模型PLATO以及基于PLATO相关工做扩展升级的PLATO-2。该模型使用了最多16亿参数,发布了中英文版本。其中,英文效果超越了Google的Meena和Facebook AI Research的Blender,中文模型也远超过现有基线。

在主题为《基于计算语言学的新冠病毒分析和疫苗设计算法》的分享中,针对新冠疫情,百度研究人员把天然语言处理领域的经典句法分析算法移植到核酸序列结构分析,介绍了全球首个线性时间的RNA结构预测算法LinearFold,能够将新冠病毒基因组全序列结构分析的时间从55分钟下降到27秒。在此基础上,百度还研发出了全球首个mRNA疫苗序列设计算法LinearDesign,能够设计出结构最稳定的疫苗序列。对于新冠S蛋白,该算法16分钟内就可设计出优化疫苗序列,解决了mRNA疫苗研发中的一个重大难题。目前,百度正在积极推动和中国疾控中心、各大疫苗公司和科研机构的合做。

在主题为《天然语言处理和知识图谱技术在临床辅助决策中的应用研究》的演讲中,百度研究人员分享了灵医智惠在临床辅助决策中应用。以百度世界领先的中文天然语言处理和知识图谱等技术为基础,灵医智惠打造了强大的医疗认知计算能力,造成了医疗场景下的语言、知识和认知计算三位一体的临床辅助决策引擎。

近年来,中国AI企业、开发者及高校在国际AI顶会上的表现也愈发亮眼。ACL2020大会中,不管是论文入选量、领衔举办研讨会、同传比赛,百度都展示出中国AI行业头雁的实力。百度NLP是百度AI技术和应用的萌芽起点和带动力量,始终聚焦核心前沿,持续引领技术创新,持续引领中国NLP技术发展方向,不只为这次大会交上了一份满意的答卷,也为中国AI崛起、走向世界发展贡献了重要的力量。

推荐阅读

百度11篇论文被国际天然语言处理顶级会议ACL 2020录用

对话智能新高度:百度发布超大规模开放域对话生成网络PLATO-2

百度文心(ERNIE)荣获2020世界人工智能大会最高荣誉SAIL奖

百度天然语言处理(Natural Language Processing,NLP)以『理解语言,拥有智能,改变世界』为使命,研发天然语言处理核心技术,打造领先的技术平台和创新产品,服务全球用户,让复杂的世界更简单。

相关文章
相关标签/搜索