滴滴开源DELTA:AI开发者可轻松训练天然语言模型

8月2日消息,天然语言处理领域顶级会议ACL2019在乎大利弗洛伦萨继续召开。会上滴滴正式宣布开源基于深度学习的语音和天然语言理解模型训练平台DELTA,以进一步帮助AI开发者建立、部署天然语言处理和语音模型,构建高效的解决方案,助力NLP应用更好落地。git

 

DELTA是滴滴第22个开源项目。天然语言处理模型和语音模型是不少AI系统与用户交互的接口,这次滴滴正式这一开源深度学习模型训练框架,旨在进一步下降开发者建立、部署天然语言处理系统和语音模型的难度。github

 

滴滴天然语言处理首席科学家Kevin Knight在ACL2019现场算法

 

DELTA主要基于TensorFlow构建,能同时支持NLP(天然语言处理)和语音任务及数值型特征的训练。整合了包括文本分类、命名实体识别、天然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等重要算法模型,造成一致的代码组织架构,总体包装统一接口。架构

 

用户准备好模型训练数据,并指定好配置Configuration,模型训练pipeline能够根据配置进行数据处理,并选择相应的任务和模型,进行模型训练。在训练结束以后,自动生成模型文件保存。该模型文件造成统一接口,能够直接上线使用,快速产品化,能让从研究到生产变得更容易。框架

 

 

值得注意的是,除可支持多种模型的训练,DELTA还支持灵活配置,开发者可基于DELTA搭建成多达几十种的复杂的模型;此外,DELTA在多种经常使用任务上提供了稳定高效的benchmark,用户能够简单快速的复现论文中的模型的结果,同时也能够在此基础上扩展新的模型。在模型构建完成后,用户可使用DELTA的部署流程工具,迅速完成模型上线。从论文到产品部署无缝衔接。工具

 

目前AI开发者可登录Github(https://github.com/didi/delta)查看DELTA的详细介绍和源代码,利用DELTA加快实验进度,部署用于文本分类、命名实体识别、天然语言推理、问答、序列到序列文本生成、语音识别、说话人验证、语音情感识别等任务的系统。用户亦可在滴滴的开源平台上(https://didi.github.io/)获取更多滴滴开源项目的相关信息。学习

 

实际上,NLP和语音技术在滴滴已经有普遍的应用。经过大量应用了包括天然语言处理、深度学习、知识图谱、语音、推荐等技术,滴滴自建了基于AI的智能客服系统,能利用人工智能技术辅助人工客服,提升人工客服处理问题的效率,并减小人工客服在重复、简单问题上的处理量。此外,基于语音识别以及天然语言理解技术,滴滴也在构建驾驶员语音助手,日本和澳洲的滴滴司机即将能用语音直接“免接触”接单。而在将来,这一语音助手也将支持全方位的语音交互服务,包括影音娱乐、信息查询、车内环境调节,到乘客通讯、客服,甚至是加油、充电或维保服务。与此同时,滴滴也在积极推动相关能力的开放,经过提供一站式天然语言处理工具、一站式机器人开放平台,帮助行业合做伙伴更好地实现AI应用落地。人工智能

相关文章
相关标签/搜索