hadoop学习之路hadoop---大数据两类典型的开发流程

hadoop是一个各种软件库组成的框架,每个软件库负责Hadoop一部分功能。一开始就学习这些组件的理论知识,是相当乏味的。先以两个典型的开发流程来描述各个组件的所处的位置以及实现的功能。 大数据离线计算典型流程一: 如图典型的大数据开发流程:数据采集→数据清洗(存储)→数据分析→数据展示 数据来源是多样的,最常见的是服务器日志,爬虫爬取数据,js埋点获取数据,存在关系书库的数据,不动数据源采用不
相关文章
相关标签/搜索