移动互联网时代,精细化运营逐渐成为企业发展的重要竞争力,“用户画像”的概念也应运而生。用户画像是指,在大数据时代,企业经过对海量数据信息进行清洗、聚类、分析,将数据抽象成标签,再利用这些标签将用户形象具体化的过程。用户画像的创建可以帮助企业更好地为用户提供针对性的服务。android
与之相应,愈来愈多的第三方大数据公司,也开始依托自身的数据积累,为客户提供用户画像的服务。好比个推旗下的用户画像产品,可以对用户线上和线下行为进行大数据分析,帮助APP开发者和运营者构建全面、精准、多维的用户画像体系。下文将以个推用户画像产品为例,详解“用户画像”的技术特色和使用价值。ios
用户画像的造成须要经历四个过程,数据积累、数据清洗、数据建模分析、数据产出。其中,数据清洗和数据建模统称数据处理。在通过数据处理以后,个推产出独特的冷、热、温数据维度,并分析用户的线上兴趣偏好和线下行为场景,造成用户画像。算法
1、用户画像用了哪些技术?服务器
在数据处理阶段,个推用户画像产品的大数据计算架构采用了Kafka分布式发布订阅消息系统,具备高吞吐量、高稳定性的特色。数据清洗可利用HADOOP、SPARK来实现设备惟一性识别、行为数据的清洗等,去除冗余数据。这一过程支持交互计算和多种复杂算法,并支持数据实时/离线计算。架构
在数据建模的过程当中,个推用户画像产品主要利用了机器学习中的聚类(无监督学习)和深度学习技术,让模型对用户行为数据主动学习,进行行为判断,由此产出用户标签。机器学习
通过数据的清洗和建模,个推用户画像会造成冷数据画像、温数据回溯、热数据场景和定制化标签四种画像。分布式
冷数据画像,是指基于大数据的分析得出的用户属性,相对比较稳定,如用户的年龄层次、性别、常驻地等。“温数据”则能够回溯用户近期活跃的线上和线下场景,具备必定的时效性。“热数据”是指用户当下的场景及实时的用户特征,帮助APP运营者抓住稍纵即逝的营销机会。定制化标签是将个推数据与第三方数据结合起来,共同建模得出具备价值的特征标签。学习
2、如何构建用户画像?测试
“用户画像”的构建须要技术和业务人员的共同参与,以免形式化的用户画像。个推构建用户画像时流程以下:大数据
(1)标签体系设计。开发者须要先了解自身的数据,肯定须要设计的标签形式。
(2)多数据源数据融合。在建设用户画像时,个推会整合自有海量数据以及该APP自身的数据。
(3)实现用户统一标识。多数状况下,APP的众多用户分布于不一样的帐号体系中,个推会将其统一标识,帮助APP打通帐号,实现信息快速共享。
(4)用户画像特征层构建。即将每个数据进行特征化。
(5)画像标签规则+算法建模。二者缺一不可,在实际的应用中,算法难以解决的问题,利用简单的规则也能够达到很好的效果。
(6)利用算法对全部用户打标签。
(7)画像质量监控。在实际的应用中,用户画像会产生必定的波动,为了解决这个问题,个推建设了相应的监控系统,对画像的质量进行监控。
总之,个推用户画像构建的总体流程,能够归纳为三个部分:
第一,基础数据处理。基础数据包括用户设备信息、用户的线上APP偏好以及线下场景数据等。
第二,画像中间数据处理。处理结果包括线上APP偏好特征和线下场景特征等。
第三,画像信息表。表中应有四种信息:设备基础属性;用户基础画像,包括用户的性别、年龄层次、相关消费水平等;用户兴趣画像,即用户更有兴趣的方向,好比用户更偏好拼团类APP仍是海淘类APP;用户其它画像等。
在个推用户画像构建的过程当中,机器学习占据了较为重要的位置。机器学习主要应用在海量设备数据整理、数据清洗、数据存储的过程当中。
3、用户画像能作什么?
用户画像对电商类、新闻资讯类APP的做用不言而喻,能够帮助APP打造精准推荐系统,实现千人千面的运营。
基于用户特征的个性化推荐
APP的运营者能够经过个推用户画像提供的性别、年龄层次、兴趣爱好等标签,分别展现不一样的内容给用户,以达到精准化运营的目的。
基于用户特征指导内容推荐
基于用户特征指导内容的推荐是指找到与目标群体类似的用户群,并利用该类似用户群的行为特征对目标用户进行内容推荐,具体过程以下图:
在实现这一内容推荐的过程当中,类似性建模技术起着不可忽视的做用。类似性建模可类比于聚类建模,是无监督学习中的一种。它能够寻找数据中的特征,把具备相同特征的数据汇集在一组,并赋予这些汇集在一块儿的数据相同的特征标签。根据这些特征标签,寻找具备这些特性的用户,给他们推送相同的内容。
这种推荐方式的优势是,它的自有特征是通过APP长期积淀而来,颗粒度更细,适用性更强,对用户的认识更全面,效果能持续提高。并且它还能针对APP所处行业与自身需求,量身定制匹配算法,让推荐更精准。
此外,个推用户画像可以结合第三方数据作定制化建模,经过双方共同建模得出显著价值和特征标签。这种标签增补的方式不只能保证推送的内容更精准,同时也能够很大程度地提高流量价值。
4、开发者如何接入?
个推用户画像SDK的接入主要有两个方式:
• SDK集成:客户端集成个推用户画像SDK,进行初始化SDK后,返回给客户一个ID即GIUID(惟一身份标识), 此ID须要由客户端提交到客户服务器,而后服务器经过API接口传入GIUID进行查询用户画像标签数据。
• API接口调用:客户将应用名称、包名及服务端出口IP提供后,返回APP ID等相关信息。客户根据《个推用户画像数据服务接口文档》及《用户画像编码表》集成测试后方可调用API接口查询画像信息。
具体的集成文档参见如下连接:
Android:http://docs.getui.com/gexiang/start/android/
iOS:http://docs.getui.com/gexiang/start/ios/
服务端:http://docs.getui.com/gexiang/start/server/
了解用户,是为了更好地服务用户。正是APP开发者和运营者对用户认知的渴求促生了用户画像。而APP开发者只有把用户的需求放在最重要的位置,才能更好地优化用户的体验,留住用户。接入个推画像SDK,不只能够帮助开发人员提升开发决策的效率,也能够帮助APP运营人员开展精细化运营,从而提高企业的营销效率和市场竞争力。