知乎的数据同步建设、工具选型及平台化实践

在大数据系统中,我们往往无法直接对在线系统中的数据直接进行检索和计算。 在线系统所使用关系型数据库、缓存数据库存储数据的方式都非常不同,很多存储系统并不适合分析型(OLAP)的查询,也不允许分析查询影响到在线业务的稳定性。 从数仓建设的角度思考,数据仓库需要依赖于稳定和规范的数据源,数据需要经过采集加工后才能真正被数仓所使用。推动数据同步服务的平台化,才有可能从源头规范数据的产出。数据同步服务不像
相关文章
相关标签/搜索