完整数据团队Tips(关于BI系统、数据仓库、数据挖掘和数据实验的27条建议)

参考The Strong Data Science Audit: How does your organization's data strategy stack up?一文web

分析和仪表盘

  1. 使用第三方获取用户行为的工具?
    使用Google Analytics、Segment、Heap之类的工具。数据库

  2. 有没有明确的用户行为定义,仍是说只有PV?
    查看PV是了解用户在作什么的最快方法,可是还有其余更重要的事。若是之后考虑到要升级网站或者APP,那么最好的方法是将PV转化成定义好的而且清晰的事件,例如注册、购买等等。app

  3. 是否会查看单个用户维度的行为记录,仍是只是看整合的指标?
    整合统计只能让你鸟瞰你的数据,对评估运营情况有利。可是更加有效的应该是查看每一个用户历时状态下的行为。这对于开发预测用户模型和优化很是有利。机器学习

  4. 能不能监测用户在每个app和web产品上的操做?
    对用户的优化最好创建在全部平台上。工具

  5. 是否有KPI(Key Performance Indicator,关键表现指标)?
    将你的数据转化成KPI(清晰、有意义的指标,而且保障这些指标与大家公司的运营目标挂钩),这样有助于将数据更容易转化为行动。不少公司尝试产生和储存很是多的数据,而后将他们递交给须要问题答案的业务部门。但好的公司是须要知道如何讲数据转化成简单的KPI的。学习

  6. 是否每日跟踪你的KPI,仍是经过一个工具,好比自动邮件或者仪表盘?
    经过数据库或者表格并非一个有效的沟通方式。如今有不少多搭建dashboard的方案,好比MetabaseSuperset或者收费方案PeriscopeChartio测试

  7. 经理是否能够客制化他们的数据试图或者仪表盘?
    对小公司而言,展现一个仪表盘还OK。可是随着公司的发证,不一样的股东或者运营者想看到的是不一样的数据试图。所以,最好的方法是让数据为每个人提供服务,而且很好地客制化。优化

数据管道操做和数据仓库

  1. 有人须要经过SQL获取你的数据吗?
    除了漂亮的可视化和摘要,须要直接地获取你数据的工具,特别是你想让你的模型和机器学习能够更好地整合到公司业务中。网站

  2. 是否使用数据仓库?
    整合全部数据能够很方便地帮助以后的应用或者数据提供者中止服务。人工智能

  3. 是否储存全部的用户数据(即便暂时不用到它们)?
    有谁会知道如今的数据之后没有用呢,虽然小数据也每每起到很大用处。

  4. 是否有备份和回复措施?
    这是显然的。

  5. 数据仓库是不是云服务可扩展的?
    这对成长期用户很是关键,云服务每每也能提供很好地可扩展性。

  6. 是否专人监控数据仓库是否健康?
    你也能够向外部团队求助。

  7. 是否能够自动检测数据仓库写入中的失误?
    好的系统应该自动告诉你这些写入问题。

  8. 你的数据仓库系统是否能承受如今100倍的用户?
    搭建地系统不只为了解决如今的问题,并且应该还包括将来的数据。

机器学习、预测和人工智能

  1. 是否用如今一直的因子(好比用户人口特征和经验)去预测收入?
    必须用大量的所以探索公司业务中的各个环节的因果关系。

  2. 是否使用机器学习在你的产品中?
    机器学习能够优化销售、管理、UX等各个领域。在小公司中,这意味着能够将小公司转变为更大公司的可能。

  3. 是否使用灵活的预测模型预测用户行为或者产出?

  4. 是否用预测模型来改善用户体验?

  5. 若是在电商平台,是否能用个性化推荐来保证用户的投入?

实验和优化

  1. 是否执行一些测试实验?
    讲决策实验化是一个现代数据驱动组织发展的关键。

  2. 是否使用实验优化公司运营和沟通?

  3. 是否为实验提供了用以评估的KPI?

  4. 是否有一个方法能够实现自动化部署和监控正在进行的实验?

  5. 是否有合适统计验证方法来评估实验结果(而不是肉眼判断)?

  6. 是否是在执行实验前与训练有素的统计学家或者实验数据科学家沟经过,确保实验有统计、推理的说服力?

  7. 是否有平台能够储存或者分享研究结果?
    一个好的推荐是Airbnb最新开源的工具knowledge repo

相关文章
相关标签/搜索