编者:本文来自携程攻略社区开发总监李健在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了深度学习在攻略社区领域的主要应用。关注携程技术中心微信公号ctriptech,可获知更多技术分享信息。文末可下载演讲PPT。算法
携程攻略社区是携程旗下的旅游攻略类社区,致力于为旅行者提供出行指南和资讯服务。依托携程2.5亿用户总量,社区日活跃用户超过500万,并聚集3000万条真实用户的旅行和酒店点评,并有40万篇旅行游记,2000位知名旅行达人。面对数据库中浩如烟海的信息,咱们如何能去其糟粕,留其精华?数据库
攻略社区的数据比较复杂,包括了多语种,不一样篇幅的天然语言处理,如用户评论,长短篇幅的游记,景点官网页面数据;图像数据处理,如用户上传的景点照片等多种应用场景。模型须要在极短的时间内对海量的这些信息进行正确分类。微信
介绍浅层机器学习模型和深度学习模型的异同。从传统的支持向量机(SVM)起始,按部就班,引出了在今天的分享中扮演了很是重要角色的卷积神经网络模型(CNN)。网络
从最基本算法角度简单明了地指出了CNN的特色,优点和应用场景。除CNN以外,还有词向量模型(WORD2VEC),循环神经网络(RNN),长短时间记忆人工神经网络(LSTM),循环卷积神经网络(RCNN)。机器学习
在介绍了攻略社区的特殊需求和主流深度学习模型以后,下一步即是如何根据实际状况和模型特色高效知足现有的需求。根据数据类型,应用场景又可分为如下若干部分:学习
一、在天然语言处理方面,主要运用CNN模型进行语义情感分析,LSTM模型进行地址质量打分,CNN+Highway+LSTM+Attention模型完成指定景点开放时间的抓取和判断。优化
二、在图像处理方面,运用CNN进行图像分类,识别广告图片,侵权图片和非法图片。以及CNN+LSTM+Attention进行图像中物体检测以及自动生成图片对应的带情感文字描述。spa
三、在视频领域中,使用RCNN和LSTM模型对视频数据进行自动审核并生成对应文字描述。视频
四、在数据内容领域中,用模糊神经网络进行目的地和POI信息的多元信息匹配。图片
对于携程攻略社区而言,以后的工做目标除了优化现有模型外,还将从自动纠错,知识图谱,虚拟现实和更多更普遍的深度学习模型入手,进一步提升计算效率和准确率,为用户带来更多样化更好的体验。
(本文由携程技术中心李赫整理)
演讲PPT下载:
说明:本文由携程技术中心原创,如需转载请邮件niuq#ctrip.com(#改成@)。
深度学习Meetup系列:
深度学习在携程攻略社区的应用
深度学习在搜狗无线搜索广告中的应用
知识库上的问答系统:实体、文本及系统观点
用户在线广告点击行为预测的深度学习模型
知识图谱中的推理技术及其在高考机器人中的应用