监控之道 — 产品生死存亡之道

背景

在当下互联网蓬勃发展的势头之下,能够说一个产品的生死是由用户决定,由于用户口碑的传递就像互联网产品通常也是病毒式、爆发式的传播。那么保证一个产品全部调整都能随时迎合用户的体验将是任何产品生存的惟一道路,而铺平这条道路的基石就是监控。缓存

监控之道是一条艰辛之道,由于监控系统的搭建须要不断的精益求精。对于监控点的选择须要不断的提炼,监控系统的框架通用性、实效性以及对定制化需求的支撑程度都直接决定了一套监控系统的好坏。监控的系统的采集数据从时效上大体为两类:一、实时监控数据;二、上报统计数据。这两类数据根据其时效性分别具备不一样的用途,下面将分别进行介绍。服务器

实时监控数据

实时监控数据。这类数据通常多为服务监控数据。该类数据主要反映的是服务的实时情况。这个须要提供一套完备的监控数据实时采集系统,以及业务方可定制监控点的策略。业务方定制监控点,通常咱们俗称为埋点。就是在咱们比较关注的服务关键指标上加上监控点。这些关键指标点通常包括这几类:
请求总量:经过这个量一方面能够分析用户对该产品的一个使用习惯,分析流量,另外一方面能够得出最佳的运维时间点和得出服务是否须要扩容的数据依据。将请求总量经过渠道或者平台等不一样维度进行划分,经过这个能够得出不一样通道对整个服务的影响。后续能够利用该数据指标做为试新或者AB test的流量划分依据。框架

超时量:经过这个数据能够反映出服务的容量是否知足现阶段的需求,是否须要扩容。同时也能够反映在相似秒杀状况下服务对突发流量的承载能力,为临时服务扩容的数量提供数据依据。运维

成功返回量:这个数据不用多说,必要的监控点,反馈出当前的服务质量。
监控之道 — 产品生死存亡之道ide

服务各个错误的发生量:服务的总请求量减去服务的成功量,中间的差值就是失败的量。那么问题来了,你的服务哪出问题了。这个从代码上是没法直观分析的,服务的每一个阶段都有可能出问题,这就须要咱们在每一个退出服务的地方加上不一样的监控点。这样就能够统计处不一样错误的发生量,再结合代码看为何这个错误比较多,这样才能有的放矢地对服务的成功率进行改造。学习

服务的存储使用量:这个指标也不用多说,若是服务提供的是存储服务的话,那么须要标识出来目前存储了多少条数据,占用了多少存储空间。若是是缓存服务最好标识出缓存的命中量,没有命中的量。能够经过这个分析缓存的的有效利用率,以及缓存服务是否须要提供扩容。
监控之道 — 产品生死存亡之道
除了上述根据业务进行定制的监控以外,还须要对服务运行的物理机器的一些通用指标进行监控。这些指标包括CPU利用率、磁盘使用率、IO调用频次等关键指标。经过对这些数据的监控,能够帮助开发人员对一些服务异常抖动状况进行分析。尤为是在由服务混跑的物理机器上尤为容易出现这种问题。
当一个工做量很大的定时做业启动时,直接吃光CPU,致使机器上其余服务的成功率降低。另一些最简单也是最容易忽略的错误,也能够依赖这些数据对问题进行快速定位。好比磁盘已满致使日志文件写入不了,而后整个服务进程卡死在日志写入上,这种错误要是没有这些监控帮助分析可能会一时间联想不到这个问题而致使问题处理时间过长。另外有了这些监控也能够有效的帮助运维提高工做效率。日志

上报统计数据

上报统计数据,这类数据主要包括了用户操做数据的上报,客户端crash日志,用户请求服务的记录等。这类数据主要反馈了产品的策略和客户端的稳定性。blog

用户操做数据: 这类数据主要是记录了用户对APP的操做行为。经过这些行为能够分析出用户的操做链。直接能够直接反馈出用户对APP上的那些功能使用频率比较高,新用户对于引导理解能力等等。
监控之道 — 产品生死存亡之道进程

对于高频功能咱们须要减小用户操做的步骤数,尽量提升APP的可用性。好比支付宝最经常使用的两个功能一个是扫码支付,一个是付码,因此这两个功能一打开APP就可使用,对于用户来讲操做成本只有一步,十分便捷。支付宝

而对于新手指引来讲,这个监控更重要。能够经过分析用户的操做行为,能得出用户在新手指引的每一步的停留时间以及中断在哪一步。若是多数用户在其中某一步停留时间比较常,那么说明咱们的新手指引让用户产生疑惑了,用户开始思考这个步凑的含义,这是须要咱们改造的。若是用户在某一步中断了,那么这就是用户的流失点,这是APP的致命点,须要咱们能尽快进行改造。不然等到产品被用户抛弃时悔之晚矣。

用户请求参数:经过对用户请求参数的抓取分析,能够分析出用户的使用习惯以及高频场景。能为后续产品运营提供数据支持。

推荐阅读:

精心整理 | 2017下半年文章目录
CAP 定理的含义
Python学习思惟导图(附下载地址)
2018年5、六月技术文章目录(附所有文章目录)
图说TCP之滑动窗口和拥塞窗口

专一服务器后台技术栈知识总结分享

欢迎关注交流共同进步

监控之道 — 产品生死存亡之道

码农有道 coding

码农有道,为您提供通俗易懂的技术文章,让技术变的更简单!