点击流数据记录了用户在网站的几乎全部行为动做,衍生出许多行为指标,有些指标是全部网站都统一的,好比访问频率、平均停留时长等;有些指标根据网站的特征定制,好比电子商务网站的消费行为、社区网站的内容发布行为和社交媒介的信息互动行为。我习惯将用户的行为指标分为三大类,即黏性、活跃和产出,每一个分类能够包含多个行为指标来共同衡量用户在这三类中的行为表现,进而区分用户的行为特征,对用户进行分类或者综合评定,如图6-7所示。优化
图 6-1 用户行为分析分类指标[z1] 网站
用户行为指标中的黏性(Stickiness)主要关注用户在一段时间内持续访问和使用网站的状况,更强调一种持续的状态,这里将“访问频率”和“访问间隔时间”两个指标归到了黏性的分类;活跃(Activity)则更多地针对用户每次的访问过程,考察用户访问中的参与度(Engagement),因此对统计期中用户的每次访问取了平均值,选择“平均访问时长”和“平均访问页面数”来衡量活跃;黏性和活跃从用户的访问状况衡量用户可能创造的价值,多是显性也多是隐形,如品牌、口碑等,但产出(Outcomes)直接根据网站的业务衡量用户创造的直接价值输出,如电子商务网站能够选择“订单数”和“客单价”,一个衡量产出的频率,另外一个衡量平均产出价值的大小。搜索引擎
用户行为分析注意点!spa
在统计用户行为指标进行分析时,须要注意选择合适的时间段,时间段的长度不能太短,否则没法体现用户长期和持续性的行为特征,黏性指标的分析会不许确;同时短时间的用户行为也会误导对用户总体特征和价值的判断,有可能用户在该段时间内极度活跃或者极度低调,也可能用户在短期内创造了高产出,但从长期看用户创造的价值并无那么高。3d
用户行为指标统计的时间段能够根据网站业务特色和用户的行为密度进行选择,对于通常的网站,建议每个月统计一次比较合适,能够针对某些用户或分类来比较每个月的行为指标数据的变化。orm
根据须要,能够创造其余的用户行为分类,也能够基于这三类,每一个类别添加不一样的行为指标,前提是每一个行为分类可以体现其分析的价值,而且每一个分类下的指标能够有效地衡量这个分类的绩效表现,尽可能保证分类和指标分析上的独立性,不存在做用的重叠。好比,在黏性使用了访问频率,访问次数越多相应的总的访问页面数(Pageviews)也越多,若是在活跃中选择总的Pageviews,指标间就存在相互的关联性,进而对分析结果产生重复的影响,因此这里选择每一个访问的平均访问页面数来保证指标的独立性。基于行为分类和指标的独立性,就能体现出不一样的分析价值。blog
用户行为分析还有一种更简单的方法——RFM分析,仅选择三个指标:索引
w 最近一次消费(Recency)ci
w 消费频率(Frequency)get
w 消费金额(Monetary)
RFM分析原先用于传统营销、零售业等领域,适用于拥有多种消费品或快速消费品的行业,只要任何有数据记录的消费均可以用于分析。在网站分析中电子商务网站能够直接套用,其余网站也能够基于RFM的分析思路进行修改后使用。
提取相关数据以前,首先须要肯定数据的时间跨度,根据网站销售物品的差别,肯定合适的时间跨度。若是经营的是快速消费品,能够肯定时间跨度为一个季度或者一个月;若是销售的产品更替的时间相对久些,如电子产品,能够肯定时间跨度为一年、半年或者一个季度。由于RFM也是基于用户持续行为的分析,因此不建议获取短期内的数据。
其中最近一次消费(Recency)取出来的数据是一个时间点,须要计算与当前时间的间隔,单位能够是天,也能够是小时;消费频率(Frequency)这个指标能够直接对每位用户的消费次数进行计数获得;消费金额(Monetary)这里取的是该时间段内每位用户的消费总额,经过相加(SUM)求得。获取三个指标的数据之后,须要计算每一个指标数据的均值,分别以AVG(R)、AVG(F)、AVG(M)来表示,最后经过将每位客户的三个指标与均值进行比较,能够将客户细分为8类,见表6-1。
表 6-1 RFM分析用户分类
访问间隔 |
访问频率 |
消费金额 |
客户类型 |
é |
é |
é |
重要价值客户 |
é |
ê |
é |
重要发展客户 |
ê |
é |
é |
重要保持客户 |
ê |
ê |
é |
重要挽留客户 |
é |
é |
ê |
通常价值客户 |
é |
ê |
ê |
通常发展客户 |
ê |
é |
ê |
通常保持客户 |
ê |
ê |
ê |
通常挽留客户 |
注:“é”表示大于均值,“ê”表示小于均值
表6-1中,咱们能够认为当消费金额大于均值时该用户可以创造较高价值,所以是网站的重要用户;访问频率高于均值,用户访问比较持续,应该保持这种持续性,而访问频率太低的用户须要提高他们的访问频率,属于须要发展的用户;最近访问间隔从某种程度上反映用户流失的倾向,间隔时间越长用户流失的可能性越大,对于这类用户须要重点挽留。
RFM模型包括三个指标,没法用平面坐标图来展现,因此这里使用三维坐标系进行展现,其中X轴表示Recency,Y轴表示Frequency,Z轴表示Monetary,坐标系的8个象限分别表示8类用户,根据上表中的分类,能够如图6-8所示进行描述。
图 6-2 RFM分析用户分类三维图
原始的RFM分析只能分析有交易行为的用户,而对访问过网站但未消费的用户因为指标的限制没法进行分析,这样就没法发现潜在客户。因此在分析电子商务网站的用户时,因为网站数据的丰富性,不只拥有交易数据,并且能够收集到用户的浏览访问数据,能够扩展到更广阔的角度去观察用户。
基于上面用户行为指标的统计结果,能够结合一些图表来表现每一个行为的用户分布状况。Google Analytics上面在用户行为模块中对新老用户占比、访问频率和间隔、访问时长和深度的分布状况进行分析和展示,如访问频率的用户分布状况,使用了条形图进行展示,如图6-9所示。
图 6-3 Google Analytics用户访问频率分布图
图6-9展示了访问次数在1~5次的用户的访问数和页面浏览数,及访问数和页面浏览数在整体中所占的比例。用于展示数据分布状况的图表有不少,好比用饼图能够显示每一个数据类别的比例,能够用于新老用户占比的展示,最经常使用是直方图,直方图与柱状图比较相似,而柱状图经常使用来展示不一样数据项的数量大小,如每一个省份的访问数,这里的横坐标省份间是相互独立的,因此每一个柱形之间是相互分离的,而直方图则经常使用于展示频数和分布,横坐标的数据通常是连续的,因此直方是紧靠在一块儿的,不少时候横坐标是基于分组的数据,咱们将用户的客单价分组后展示每组数据的用户分布比例,如图6-10所示。
图 6-4 客单价用户分布图
图6-10中,将客单价每隔30进行分组(图中30显示的是客单价为0~30的用户比例,以此类推),大于300的独立一组,统计每组用户数及所占比例并展现。数据的分组尽可能使用同样的组距,这样可让数据看上去更均匀,但有时候因为数据分布比较特殊,使用不相同的组距也何尝不可,但要注释清楚。直方图的分组个数在6~20比较合适,若是横坐标的分组或数据项异常多,可能展示出来的直方图看上去会很是密集,这时能够借助“趋势线”来观察数据的总体分布状况,或者使用带平滑线的散点图,如图6-11所示。
图 6-5 访问间隔天数用户分布图
图6-11所示的是近60天中访问的用户的最近一次访问距离当前的间隔天数的用户分布图,显示了每一个访问间隔天数的用户比例,由于没有对数据作分组,横坐标显示了连续的60天的数据,因此使用了带平滑曲线的散点图进行展示,可以比较直观地展示用户的保留状况。咱们能够从图中获得一些其余信息,好比能够定义访问间隔天数超过两周的为沉默用户或者休眠用户,只要取访问间隔天数超过14天的用户就能够获得相应的用户比例;若是定义访问间隔超过30天的用户为流失用户,也能够从图表中计算获得流失的用户比例。因此基于用户的行为分布图能够获取一些额外的用户统计指标。
直方图或者带平滑曲线的散点图都只能表现用户分布的频数或比例中的一个指标,借助排列图能够将频数和比例同时展示在一张图中,如图6-12所示。
图 6-6 消费次数用户分布排列图
图6-12的排列图也叫帕累托图,原先主要用于产品质量管理的领域,用于统计和分析引发产品质量问题的主要因素,使用直方图表示数据分布的频数,使用折线图表示数据分布的频率的累计。从这个消费次数的用户分布图中能够获得不少信息:零消费(消费次数为0次)用户比例与消费(消费次数大于0次)用户比例、单次消费(消费次数为1次)用户比例和屡次消费(消费次数大于1次)用户比例,因此基于用户分布图一样能够作用户的行为细分。
散点图较多地用于表现两个指标之间的联系,在相关分析和回归分析中较经常使用,但其本质也是展示数据的分布,并且是基于两个指标展示数据点的分布位置,这里选择用户访问的平均停留时长和平均浏览页面数来绘制散点图,如图6-13所示。
图 6-7 平均访问时长&页面数用户分布图
图6-13中,咱们抽取了100个用户做为样本展示每位用户平均每次访问的停留时长和浏览页面数的分布状况,从图中能够发现网站中有多少用户比较活跃,例如定义平均停留时长超过3分钟(180秒)而且平均页面浏览数超过3个的用户为活跃用户,那么图中绿框范围内的用户就是活跃用户,而且越接近绿框的右上角,用户的活跃度越高。
用户行为指标的用户分布能够帮助咱们发现许多额外的信息,同时基于每期的统计结果进行比较并分析用户各行为指标分布的变化能够掌控用户的发展状况,因此按期统计和分析用户行为指标的分布状况是十分有用的。
前面对用户的分类和行为作了分析,但对于分析的输出结果,咱们可能无从下手,观察新老用户、流失用户及用户的各类行为指标和行为分布也许能够作出很好的报告,评估用户的发展状况,但结论太过宏观,咱们所能作的也只是根据分析结果调整用户的总体运营策略,其余可以采起的细节措施寥寥无几。而网站分析始终须要把握的一个前提就是分析的结果须要有效地指导行动(Take actions),因此这里就要介绍如何获得更加有效的看法(Insights)。
前面已经介绍过一些常见的用户分类:新老用户、流失留存用户等,不一样的用户分类群体可能会有不一样的行为表现,咱们能够经过分析各类用户分类的用户行为指标来区分各种用户的特征及对网站的指望要求,进而针对各种用户群体进行调整和定向的营销推广。这里主要以指导内容层面的调整为导向,经过比较各用户细分群体对内容需求的差别,优化内容运营,将优质的内容或者符合用户偏好的内容推荐给相应的用户。这里举例三类用户细分,即流失用户与留存用户、新用户与老用户、单次购买用户和二次购买用户,基于这三类细分,对每一个分类的用户购买商品进行比较分析,明确哪些商品更加符合用户的预期。
这里的细分比较仍是以电子商务网站的数据为例,首先是基于流失用户和留存用户,电商网站的内容就是商品,咱们基于每一个商品计算购买这些商品的用户中购买以后形成流失的用户比例,如图6-14所示。
图 6-8 流失用户和留存用户细分比较
首先要明确一下图中各指标的定义,每一个商品的流失用户比例应该是购买该商品后流失的用户数在全部购买该商品的用户中的占比,但只知道每一个商品的流失用户比例没法评价这个商品是否对用户保留有促进做用,或者在必定程度上形成了用户的流失,只有经过与整体水平的比较才能得出相应的结论。因此这里须要重点解释的是“与整体比较”这个数值是怎么计算获得的,这里的百分比不是直接相减的结果,而是一个差别的幅度体现,这里假设整体用户流失率为56%,那么以A商品为例,与整体比较的结果是:( 58.13% - 56% ) / 56% = 3.80%,使用一样的计算方法也能够获得其余商品与整体比较的差别幅度。最后就是展现,在Excel中经过“条件格式”里面的数据条功能能够直接展示出图中的效果,很是方便。
图6-14中截取的Excel数据条的展现效果基于Excel2010,Excel2010开始支持双向的数据条,以零为界,正数向右负数向左,2010以前的版本仅支持单向的数据条。数据条左右方向的颜色均可以自定义,默认负数为红色、正数为绿色,基本思路是红色表示指标表现较差,绿色表示指标表现较好,这里由于与整体比较流失率较高(正数)表现为很差,比整体低(负数)表现较好,因此对数据条的左右颜色进行了互换,正数为红色,表现较差,负数为绿色,表现较好,以后的图表也听从这个原则。
很明显,图6-14中的分析结果对运营调整有直接的指导性,目的是促进用户保留,因此咱们要作的就是将有利于用户留存的商品(F商品的用户流失率明显要比整体低得多,说明F产品更有利于用户保留)推荐给用户,而将那些可能致使用户流失的商品(C商品)进行优化或者下架。
一样,使用上面的方法能够区分不一样用户群的购买偏向。新老用户的细分是最多见的用户细分方法,咱们可使用相似的方法来看看新老用户对商品的不一样喜爱,如图6-15所示。
图 6-9 新老用户细分比较
从图6-15中你看出了什么?购买D商品的用户中新用户的比例明显偏低,也许新用户根本就不喜欢这个商品,而B商品和F商品显然更加符合新用户的口味。若是你的网站能够进行新老用户区分的定向推广,那么上面这个分析结果将让你受益良多。
固然,这个数据呈现的特征可能跟商品的推广渠道有必定关系,好比图6-15中的D商品可能使用老用户比较集中的推广渠道(如EDM),那么购买用户中天然老用户的比例会偏高;或者把某些商品放在新用户比较集中的Landing Page中展现,那么购买该商品的新用户比例显然也会偏高。因此,在作此类分析时须要注意根据推广渠道的差别,具体问题具体分析,不能一律而论。
再来看一下相似的方法怎么促成用户的重复购买。对于电子商务网站而言,用户的首次购物体验很是重要,这会直接影响用户是否会产生再次或者以后的屡次购买,或者是否可以成为网站的忠诚客户。若是你的网站注重用户关系管理,有足够的数据支持,那么能够尝试下使用如图6-16所示的分析方法。
图 6-10 首次二次购买用户细分比较
须要注意的是,这里的基础用户群设定在了每一个商品的首次购买用户(不是全部用户),咱们要分析的是全部将该商品做为首次购买商品的状况下,用户是否还会发起以后的再次甚至屡次购买行为(这里的二次购买用户不是指购买次数是2次的用户,而是指全部购买次数超过1次的用户),从而评价商品对于首次购买体验的影响好坏。从图6-16能够看出,B商品和F商品在促成二次购买的表现不佳,颇有可能商品的使用或质量问题影响了用户的满意度,阻碍了用户再次购买的脚步。根据分析结果,咱们尤为须要对那些二次购买率比整体水平低不少的商品进行重点关注,同时也须要根据商品的特征进行分析,有些商品确实比较容易促成二次购买,由于可能存在交叉销售和向上营销的状况。
若是你从Google Analytics上寻找相似的数据,其实惟一能够找到的就只有新访问比例,由于GA无法细分首次购买和二次购买用户,而流失和留存用户是网站的自定义指标。在GA的内容模块里面细分到每一个页面的指标也未包含% New Visits(在流量来源、地域细分里面有该度量),因此须要自定义报告来查看网站每一个页面的新访问比例,比较的基准仍是网站整体的新访问比例,GA的展示方式选择里面直接提供了与整体比较的视图“Comparison”,图6-17是我作的自定义报表。
图 6-11 GA基于内容细分新老用户比较
如图6-17所示,GA上面展示的效果和用Excel 2010定制条件格式后的效果很像,这种基于基准的比较展示很是直观实用,其实在其余分析中一样能够用到。个人博客文章的新用户比例比较中能够分析出什么?访问数排在前几名的文章中很明显的趋势就是概念性和方法论的文章的新用户比例高于均值(固然主要靠搜索引擎的帮忙),而观点性和分析性的文章的新用户比例低于均值(老用户更偏向于实践和应用),因此若是个人博客能够动态向新用户和老用户展示不一样的内容,那么这个分析将十分有价值,也许你的网站能够尝试一下。
最后用一句话总结:细分是用于比较的,比较是为了反映差别进而作出调整优化的,因此细分的目的最终仍是指导运营决策,这才是数据分析的价值体现。