大数据技术总结

本文用来记录大数据的各项技术,用做技术提纲前端 1、数据接入 kafka 消息管道 可配置多个缓存副本(推荐) Flume 直接写到目的地,Cloudera开源的一套日志传输系统,和Scribe相似。 Scribe Facebook开源的一套日志传输系统,将源日志传输到Hadoop等分布式文件系统中。 Sqoop 用于传统数据库和Hadoop之间的数据传输。 RDL 结构化和非结构化数据传输组件
相关文章
相关标签/搜索