JavaShuo
栏目
标签
DataLake with Hadoop Ecosystem
时间 2021-01-08
标签
DataLake
Hadoop
栏目
Hadoop
繁體版
原文
原文链接
Hadoop是实现数据湖最常用的技术手段,目前是最理想的选择,Hadoop生态系统提供批处理、实时处理引擎,还提供海量数据存储能力,数据处理架构如下图: 目前常见的两种使用方式: 1) 第一种方式是将Hadoop作为ETL工具,并且数据备份或者冷数据存储其PB级别数据,在Hadoop中数据冗余而且较容易恢复,如下图所示: MapReduce及Spark Engine可以用来处理非结构化数据,
>>阅读原文<<
相关文章
1.
Hadoop ecosystem
2.
Hadoop ecosystem 生态圈
3.
Data ETL tools for hadoop ecosystem Morphlines
4.
Create a "collaborative ecosystem" with blockchain
5.
DataLake in Azure
6.
DataLake in Hortonworks
7.
Big Data Ecosystem Dataset
8.
DataLake in AWS
9.
DataLake 基本概念
10.
Kafka Ecosystem(Kafka生态)
更多相关文章...
•
XSLT
元素
-
XSLT 教程
•
TiDB数据库的应用场景
-
NoSQL教程
•
为了进字节跳动,我精选了29道Java经典算法题,带详细讲解
•
TiDB 在摩拜单车在线数据业务的应用和实践
相关标签/搜索
ecosystem
hadoop
with+this
with...connect
with...as
by...with
11.hadoop
php+hadoop
spark+hadoop
hadoop+hbase
Hadoop
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
python的安装和Hello,World编写
2.
重磅解读:K8s Cluster Autoscaler模块及对应华为云插件Deep Dive
3.
鸿蒙学习笔记2(永不断更)
4.
static关键字 和构造代码块
5.
JVM笔记
6.
无法启动 C/C++ 语言服务器。IntelliSense 功能将被禁用。错误: Missing binary at c:\Users\MSI-NB\.vscode\extensions\ms-vsc
7.
【Hive】Hive返回码状态含义
8.
Java树形结构递归(以时间换空间)和非递归(以空间换时间)
9.
数据预处理---缺失值
10.
都要2021年了,现代C++有什么值得我们学习的?
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
Hadoop ecosystem
2.
Hadoop ecosystem 生态圈
3.
Data ETL tools for hadoop ecosystem Morphlines
4.
Create a "collaborative ecosystem" with blockchain
5.
DataLake in Azure
6.
DataLake in Hortonworks
7.
Big Data Ecosystem Dataset
8.
DataLake in AWS
9.
DataLake 基本概念
10.
Kafka Ecosystem(Kafka生态)
>>更多相关文章<<