数据的采集和同步,是先将数据从设备、或者本地数据源采集、同步到阿里云上,而后在阿里云上对数据进行分析和处理,最终完成您的业务要求。本文向您介绍阿里云各产品的数据采集和同步的操做实战文章,您能够根据您使用阿里云产品,查看相应的文档教程。html
关于数据采集,DataWorks专门有一个模块叫作数据集成,是阿里巴巴集团对外提供的稳定高效、弹性伸缩的数据同步平台。致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据移动及同步能力。详细介绍请参见数据集成概述。数据库
MaxCompute
Hadoop数据迁移MaxCompute
https://help.aliyun.com/docum...后端
JSON数据从OSS迁移到MaxCompute最佳实践
https://help.aliyun.com/docum...网络
JSON数据从MongoDB迁移到MaxCompute最佳实践
https://help.aliyun.com/docum...函数
DataWorks
新增日志服务(Loghub)经过数据集成投递数据
https://help.aliyun.com/docum...oop
新增ElasticSearch经过数据集成导入数据
https://help.aliyun.com/docum...大数据
数据集成最佳实践—OTSStream配置同步任务
https://help.aliyun.com/docum...阿里云
RDS迁移到Maxcompute实现动态分区最佳实践
https://help.aliyun.com/docum...日志
Elasticsearch
使用DataWorks实现Hadoop与Elasticsearch数据同步
https://help.aliyun.com/docum...code
使用DataWorks实现MaxCompute与Elasticsearch数据同步
https://help.aliyun.com/docum...
阿里云上数据导入阿里云ES(离线)
https://help.aliyun.com/docum...
同步 MySQL 数据库到 Elasticsearch 中并进行搜索分析
https://help.aliyun.com/docum...
AnalyticDB
经过DTS实时同步RDS for MySQL数据到AnalyticDB
https://help.aliyun.com/docum...
使用数据集成迁移
https://help.aliyun.com/docum...
使用kettle将本地数据导入分析型数据库
https://help.aliyun.com/docum...
DataHub
数据同步DTS将RDS数据实时传输至DataHub
https://help.aliyun.com/docum...
流数据同步DataConnector
https://help.aliyun.com/docum...
函数计算做为DataHub后端服务
https://help.aliyun.com/docum...
扩容缩容Merge/Split
https://help.aliyun.com/docum...
Datahub具备服务弹性伸缩功能,用户可根据实时的流量调整Shard数量,来应对突发性的流量增加或达到节约资源的目的。
更多大数据实战文章
玩转大数据系列之一:数据采集与同步
https://yq.aliyun.com/article...
玩转大数据系列之二:数据分析与处理
https://yq.aliyun.com/article...
玩转大数据系列之三:数据报表与展现
https://yq.aliyun.com/article...
玩转大数据系列之四:搜索服务