对话 CTO〡听 GrowingIO CTO 叶玎玎讲无埋点数据分析的业务理想

​​专栏介绍前端

「对话 CTO」是极客公园的一档最新专栏,以技术人的视角聊聊研发管理者的发展和成长。程序员

本专栏由ONES 的创始人&CEO 王颖奇做为特邀访谈者。王颖奇曾参与金山软件 WPS、金山毒霸等大型软件的核心开发工做;2011 年创立了正点科技,旗下产品正点闹钟、正点日历在全球用户过亿;2014 年,王颖奇在知名美圆基金晨兴资本任 EIR,并以我的身份参与十余家公司的管理咨询工做;2015 年,王颖奇创立 ONES,致力于提供企业级研发管理解决方案。算法

摘要数据库

创立之初,GrowingIO 以无埋点技术切入市场。为了让数据平台能够帮助客户作深度的用户转化、留存分析,GrowingIO 花了三年多时间去打磨产品。后端

正如 GrowingIO 联合创始人&CTO 叶玎玎所说,真正去作一个 SDK 来采数据其实很容易,可是要作 SaaS 服务,要针对不一样用户的不一样写法去作通用型的开发,还要考虑应用开发自己的一些易变化特性等等,这些都须要很强的技术支持。浏览器

叶玎玎曾在网易杭州研究院从事工程数据库相关工做,2009 年接触 SaaS,2015 年到 GrowingIO 负责核心产品研发。机器学习

本期对话 CTO,咱们请到了 GrowingIO 联合创始人&CTO 叶玎玎。关于 GrowingIO 产品如何支持业务发展,以及数据分析产品的历史演进,叶玎玎谈了谈本身的见解。工具

产品作给业务端学习

颖奇:很高兴 GrowingIO 的 CTO 叶玎玎同窗能接受咱们的访谈,我以为能够先大概讲一下 GrowingIO 在技术方面的一些特长。大数据

叶玎玎:OK,若是要研究 GrowingIO 的技术,必定要先了解它的形态。GrowingIO 是一家云的公司,作 SaaS 的公司,因此咱们全部的客户数据的采集都会在云上。

目前咱们第一个技术特色就是外界所熟知的无埋点,自动去采集用户从打开应用或者打开网站到离开的全部行为数据,这个行为数据经过可视化的定义方式去展示。其实这会涉及到你如何去理解客户端的实现,不管是对浏览器自己的实现,仍是对于 iOS 或者安卓操做系统的实现,这里都须要不少黑科技的东西。去了解它的实现后才能更好地在上层去研究怎么作无埋点的逻辑。因此这个是咱们在过去三年花了不少时间去研究的东西。

真正去作一个 SDK 来采这些数据其实很容易,可是要作 SaaS 服务,如何针对不一样用户的不一样写法去作这个通用型的开发,而且是插件,包括这里面还要考虑如何去应对应用开发自己的一些易变化特性等等,这里须要作不少东西。

因此咱们在这个过程当中本身也用了不少方法,经过算法、模型、机器学习等方式,考虑怎么去让前端采集到的数据跟后端用户的数据逻辑之间更好的匹配,因此这个就是外界所熟知的 GrowingIO 的无埋点。但本质上另一个挑战在于,当有这么大数据量进来的时候,我怎么去处理数据?我相信 GrowingIO 数据量在国内应该算蛮大的。

颖奇:由于无埋点自己是没有筛选的来进行数据采集,因此确定会有很大的数据量。

叶玎玎:一方面是这个,另一方面也在咱们数据系统自己。举个例子,咱们天天可能有个两三千亿条的消息,我相信大部分公司都达不到这个量,这是第一点。第二点是,GrowingIO 有一些几个亿 DAU 的客户,单体客户几个亿,再加上云端有这么多其余的客户,怎么更好地处理、存储、查询,都是一个很大的挑战。

颖奇:那对比市场其余竞品,在数据量这方面,GrowingIO 有没有一些技术上的先进性?

叶玎玎:是有的。 GrowingIO 目前有一个不少客户认为很方便的功能——指标维度的多维交叉,实现任意去拖拽指标维度,瞬间出图。举个例子,你要进行基于人的指标维度任意交叉的时候,GrowingIO 是能够快速出结果的。具有这些属性的用户,而后作过哪些事情的用户,在历史上的任何一个时间点,能马上知道这群人,马上计算出来他们有谁。这个东西在以前的数据系统里面相对来讲是比较少的。大部分数据系统,不管是 T+1 仍是实时,仍是一个小时这种,它都是基于事件的处理。

颖奇:这就是说分析过程上大家应该是作了更多事情的。

叶玎玎:我以为是在用户画像自己,就是咱们如何去更好的找到一批用户。而后这个过程包括,若是你找一个其余的用户分析系统,你想要看留存,或者说要去作转化路径,要找到哪些优化点,那核心其实就在于对于用户之间群体的对比。

对单一人群去作分析其实很容易,可是一旦要将用户之间对比各类东西,而后又要达到很是快的响应效果,这个实际上是其余竞品很难作到的。这里最核心的差异是说,由于咱们一直是作给业务端的,就是产品运营等等,因此咱们的要求就是他们能很是简单的从咱们的分析工具里面去获得结果。

颖奇:因此 GrowingIO 在无埋点等技术上有哪些关键特色呢?

叶玎玎:无埋点确定是咱们一个关键特色,由于使用其余产品的话,你可能须要本身去梳理全部东西,咱们是让那个业务直接能够本身去作。而后第二点是基于这个能力上来讲,自己咱们会演变出来新的一层能力,咱们能快速作实验。好比我如今想要一个东西,这个时候我不是找研发去帮我作打点,而是直接能够看到结果。我当时本身为何以为 GrowingIO 很值得作,就是由于我以前用其余数据分析工具时,陷入到数据采集-使用、采集-使用的整个不停的轮回之中,这个过程当中,大量时间其实被浪费在前端的采集和处理这一块,真正进入到核心的产品逻辑的迭代和产品的改进的时间是比较少的,而 GrowingIO 就不会有这样的问题。

高效能远程工做

颖奇:我了解到您以前是有作过远程团队的工做,您以为远程工做这样的方法在中国如今是否是真正可以去很好的来实行?

叶玎玎:我我的判断相对是比较难的,它必须变成两种模式。远程工做要么就是全员远程,这个事情反而是能够作的。由于全员远程意味着你们每一个人都接受了,我必需要为了咱们的效率提升付出额外的努力,而后为了下降个人沟通成本,我要作哪些事情。我以为这个是很是关键的。但这里面若是存在大部分人不远程,某一两我的、两三我的远程的状况的话,这个就会变得很是尴尬。由于不少时候最高效的沟通确定是面对面沟通,而后在面对面沟经过程中,有一我的若是在远程的话,那不少时候他其实不知道其余人在聊什么,由于除了语音、视频之外,还有一些肢体语言等等,而后聊着聊着很容易的一点就是你们把远程的人忽略掉了。

因此我我的的建议是若是全员远程,这个是 OK 的。可是这种模式是否能演变出来很是快地去响应变化,这是有一些潜在风险的。因此这个意味着整个团队的认知须要达到必定的高度,而后整个团队为了达到更高的效率,更好的沟通,愿意付出什么。若是你去评估这两点以后,以为这是本身可承受的风险,那能够选择。若是对一个创业公司的话,我以为这个多是比较难的。可是若是对于一些看着需求作事的公司来说多是没有任何问题的,由于这个过程当中无非是我怎么把项目管理作的更好。或者还有不少公司选择了另一种模式,其实不算远程,就是一个多地的办公室。

颖奇:前一两年的时候,由于一些效率工具的出现,你们都说可能将来是远程工做的时代,人会愈来愈依赖工具。可是如今咱们愈来愈以为,真正工具刚需的来源不是由于远程工做,面对面的时候咱们也是须要工具的。

叶玎玎:我以为工具的核心不是为了解决远程的问题,而是人是在流动的,是不必定都在一块儿的。好比风车到最后服务的团队多是在一个 office,可是由于你们都出去了,因此在这个过程当中怎么去分配工做,怎么去沟通等等,(工具自己)仍是解决相似这类问题。

围绕用户作分析

颖奇:您怎么看待中国数据分析行业的过去、如今、将来?包括过去一代二代的数据分析产品,如今的数据产品,能够来分享一下您的见解。

叶玎玎:我以为最先的应该不叫分析工具,叫统计工具。像 CNZZ 也好,像百度统计也好,作流量的一些统计,核心是在流量层面。

而后再往下,你们会说光是统计还不行,要进入分析,要了解一下个人用户整个状况是怎样的,那这个时候会演变出来第二代的数据分析产品,就是基于事件的。由于每一个事件都会对应到人,既有事件的模型又有用户的模型,这个用户到底作了哪些事情,而后去筛选用户,这个是第二个阶段。

目前大部分的工具应该也在这一层,包括在 2010 年左右出来的友盟、Talking Data 为表明的一系列工具,当时它们承载的不少可能就是流量统计的功能,可是它们也有事件模型。而后再到下一代,从事件自己到开始运营用户的生命周期了,就是到用户这一层。

颖奇:到用户这一层了,就是会把它组合起来看。

叶玎玎:是的,我经过事件去更具体的去看一个用户,核心围绕着用户来作分析,不是核心围绕着事件来分析。因此咱们全部的人的模型在整个数据分析里面就会成为第一个关注点,这个是很重要的。而后再往下的东西也跟这个时代相关,由于如今有不少机器学习,你要去作个性化,这个过程当中,你怎么去更好的基于机器学习来作东西,不管是从各类推荐引擎,或者说各类的计算模型,这样演变出来好比作 alert(提醒)、anomaly detection(异常检测),那这些又会进入到下一个阶段。可是这里的全部都是基于你的数据层是干净的。数据这一层要有一个好的基础,否则想着跳到下面步骤的话是很难的。

颖奇:在您刚才讲的用户精准个性化的一些业务上,咱们如今看到的这些数据平台更可能是帮忙分析,大家会有一天可以真正走到业务中去吗?好比说可能会提供一些数据的接口,或者提供一些很是精准的画像,每个客户最终都会跟真正业务端的服务对应起来。

叶玎玎:其实咱们如今就在作了,我刚才提到,理论上咱们的客户主要打的仍是业务端,好比产品、运营,他们用咱们系统就在作这件事情,真正走到业务里面去,他们在咱们系统上去定义各类东西。举个例子,咱们可让系统找出来,好比昨天注册了,看了 Demo,可是没有继续去作建立项目的人。这群用户筛出来之后,针对这些用户能够去作触达。而后好比在作哪些事情的过程当中,你到底要给他一个什么样的动做,这些东西是咱们在帮咱们客户作的,因此它实际上是很是业务化的。

颖奇:可否给你们介绍下您的我的职业经历?

叶玎玎:我以前在网易杭州研究院工程数据库相关的组里面工做了一年半,2015 年以后在作 GrowingIO。中间有几个节点,第一个是我最先远程是 Freelancer,那时候更可能是帮美国的一些创业者去作 0 到 1。而后 09 年到 12 年,我从本身研发的这个点更加往外扩出去,负责产品研发,作企业社交这一块。可是我是从 09 年开始真正去接触 SaaS 这个行业,而后接触 to B 这个方向。

09 年的时候,咱们很是看重怎么去作实时 Web,由于它在 09 年的时候其实没有太好的解决方案,但那个时候咱们为了本身作的东西,就作了不少技术上的突破。而后到作协做工具也是,就是怎么把用户体验和当时实施的技术更好的打包成一个方案表给到用户。而后到 14 年末开始作无埋点,也是在当时很是新的一个东西。

12 年末到 13 年又作了另一个蛮好玩的事情,就是 Teahour,一个技术播客。我以为当时 Teahour 对不少刚工做一两年的或者在刚毕业要找工做的那群人给了不少方向性的指导。

颖奇:您以前一直在作程序员,也一直在作本身的项目,那最终变成一个这么大公司的 CTO,中间有什么特别重要的一些转变,或者您以为比较关键的时间点或者里程碑,经历了以后就变成一个 CTO 了。

叶玎玎:由于我从 06 年毕业的时候就开始创业,无非是一开始创业相对来讲团队的人数可能比较少,而后会经历一个团队从小变大的过程。我会很是关心用户究竟是怎么想的,对我来讲,为何我对数据分析很感兴趣的一点,在于我会尝试经过这个去理解到底用户在用个人产品的时候他内心的想法。因此我以为很核心一点是,我本身是在思考到底这个业务和产品应该怎么来作的,因此我以为我跟大部分的技术不太同样,我会很容易在用这样的视角去思考。

颖奇:很是棒。最后可不能够推荐一些您最近看的认为比较好的书给你们。

叶玎玎:我看的书会比较更加偏意识形态一点,更加偏管理一点。我最近一直在看《赋能》,《赋能》这本书核心讲在如今这个时代,你到底应该有什么心态,应该怎么去更好的发展等等。

颖奇:好的,今天有不少收获,很是感谢。

图片描述

想要更好更快地发布产品?请扫描二维码,或访问http://ones.ai 了解更多。

相关文章
相关标签/搜索