在2015年初,咱们在Uber规划了一个官方的数据科学团队。这个主意的缘起是:经过可视化数据探索工具从Uber的数据中发现洞见。天天,Uber 管理上亿级别的GPS位置信息。每分钟,咱们的平台处理上百万的移动事件。每次咱们不用技术分析就直观地知道这是一个咱们错过了解咱们业务的好机会。react
自成立以来,这个数据可视化团队就不断发展壮大,从我和另一个工程师两我的发展到了如今的15人的全栈团队。数据可视化技术专家囊括了从计算机图形学到信息设计、封面创意技术以及 Web 平台开发。咱们团队专一于从视觉分析到地图绘制以及从框架开发到面向公众的数据可视化的整个过程。git
让咱们看看都作了哪些工做:github
AB测试平台的表格和置信区间可视化
可视化分析主要都是由抽象数据可视化组成的。这个涉及到可视化工做的数据是没有内在的地理结构。与之相反的是科学可视化,这种可视化从物理世界(地图、3D物理结构等等)的角度描述了数据。大多数有效的可视化分析在这种状况下都是关于报告、仪表盘、实时分析的图标和网络图。咱们的团队在大多数商业洞见应用和商业数据探索上增强了可视化图层。其余地区的同事用咱们的可视化工具增强了包括咱们的AB测试平台和内部的大规模机器学习平台的可视化效果。segmentfault
咱们团队强调建设像咱们建立这个应用相似的可复用组件。咱们最近开源了react-vis
,这是一个 React 和增强版的D3 可视化库,它提供了 基于JSX的语法,专用的语言来组织图表的坐标、图标类型以及其余一些可视化元素。它支持开发人员以声明的方式在他们的数据集用 React- 和 JSX-友好型的形式来塑造他们想的可视化效果。浏览器
在地图绘制上咱们也在作相似的工做。安全
基于地图的信息是咱们在Uber最大最丰富的资产。然而,一方面,天天咱们的平台实时采集上亿的GPS点。另外一方面,咱们必须在浏览器内实现数据密集可视化。这些都对实时地图可视化做出了极大挑战。微信
在给定半径区域内拖动鼠标将能够实时看到Uber的目的地分布状况
咱们为不一样顾客量身定制多种地图应用。其中一类顾客是在Uber运营的400多个城市内的总经理和城市运营团队。这个普通人须要有一个当前供求分布的及时信息。他们也须要获取聚合数据来理解城市的市场以便于进一步的策划市场营销活动。另外一类用户是数据科学团队,他们须要丰富的数据探索界面来操做多维数据(经过产品、时间、地理数据来向下钻取)。咱们为其余团队构建能够分块和切片的应用以便于从数据中得到洞见。网络
对于这些应用,咱们的技术栈是由一些咱们以前开发而且开源的库构成的。react-map-gl 提供一个在MapboxGL基础上与React相似的图层。这个MapboxGL是一个咱们在Uber普遍使用的从Mapbox引入的库。deck.gl
提供了一个建立WebGL加强图层的应用,它能够放在地图的最上层或者独自用来建立一个抽象的数据可视层。框架
deck.gl 和 react-map-gl 提供了 WebGL 界面来建立数据密集型的地图应用
可是全部这些技术均可以以一种创造性的方式被运用。数据可视化最重要的部分实际上是数据故事叙述和数据艺术化呈现。机器学习
用数据可视化讲述Uber的故事的方法有不少种。咱们能够围绕诸如安全、效率、流量、政策等话题在大众传播网络中展开可视化叙述。
最近,咱们开始了一个探索uberPool是如何让城市交通变得更高效的数据可视化项目。在 Travis Kalanick 的TED演讲以后,你将看到咱们制做的数据可视化显示每一个没有使用uberPOOL的街区流量状况,这代表了 POOL能够经过减小流量让城市变得更加智能化。
左图: SF 在没有uberPOOL时交通拥堵的城区。右图:POOL用一种聪明的办法均衡了交通流量。
咱们继续作一块儿其余的可视化叙述。这个工做范畴有趣的融合了数据做家和数据艺术化呈现所带来的挑战。数据处理和咱们咱们内部可视化探索的数据分析产品同样充满挑战。可是这时候,以人为本的美学设计和通俗易懂的解释性是比高效的信息设计技术来得更重要的。
例如,咱们开始和设计团队协做。为了动态地图能够显示天天每辆车的Uber行程,咱们拿到了品牌视频。这里的特效就是用WebGL应用为每一帧动效都在服务端渲染进行渲染而后编译到视频里造成的。这个应用关注从数据获取(经过Hive)到视频离线渲染输出技术的每个环节。
一个身临其境的 3D 动画地图匿名展现了一成天的Uber之旅:
对于这样的工做咱们也开发了一套叫作luma.gl
的框架,这套框架专一于基于WebGL的可视化应用。它根据一些诸如ES六、WebGL 2.0、组件化平台的现代技术而设计。这使得luma.gl
能够和其余诸如stack.gl
那样的流行的库一块儿互操做。
在Uber,数据使咱们最大的财富。咱们用可视化探索数据分析工具经过数据来发现洞见,并且咱们业务矩阵的数据探索也可以让咱们Uber全部城市的管理者作出更加有效的商业决策。
若是你对和咱们的Uber工程团队一块儿面对这些挑战感兴趣,你能够查看咱们的数据可视化工程的开放职位列表,而后联系data-viz@uber.com。咱们期待你的加入。
原做者: NICOLAS GARCIA BELMONTE 译者:Harryzhu
英文原文地址: https://eng.uber.com/data-viz...做为分享主义者(sharism),本人全部互联网发布的图文均听从CC版权,转载请保留做者信息并注明做者 Harry Zhu 的 FinanceR专栏:https://segmentfault.com/blog...,若是涉及源代码请注明GitHub地址:https://github.com/harryprince。微信号: harryzhustudio商业使用请联系做者。