经常使用的数据集成ETL工具备哪些?

  经常使用的数据集成ETL工具备哪些?ETL工具用于将异构数据转换为同类数据,而后由数据科学家用于从数据中得到有价值的数据,经常使用的ETL工具备Microsoft-SQL Server集成服务、AWS Glue、Apache NiFi、Informatica PowerCenter、IBM的Infosphere Information Server等。数据库

  ETL工具是什么呢?ETL是英文Extract-Transform-Load的缩写,用来描述将数据历来源端通过抽取、转换、加载至目的端的过程。ETL一词较经常使用在数据仓库,但其对象并不限于数据仓库。数据集成ETL工具:服务器

  一、Microsoft-SQL Server集成服务(SSIS)架构

  为了构建高性能的数据集成解决方案,例如提取,转换等,SSIS被认为是一个出色的平台。由用于构建和调试程序包的图形工具和向导,用于执行工做流程功能(包括执行SQL语句,FTP操做等)的任务组成。工具

  SSIS的功能:数据集成和工做流应用程,用于ETL的数据仓库工具。性能

  二、AWS Glueui

  AWS Glue是一种简单且具备成本效益的,彻底托管的无服务器ETL,用于对数据进行分类并将其跨多个数据源移动。由AWS Glue数据目录(即中央元数据存储库,ETL引擎和灵活的计划)组成。url

  AWS Glue的功能:它生成ETL脚本以将数据从源转换为目标,检测架构更改并适应您的首选项。spa

  三、Apache NiFi.net

  Apache NiFi支持转换,数据路由和系统中介逻辑的可扩展且功能强大的有向图。开发它是为了使系统之间的数据流自动化。流控制器,Web服务器,内容存储库,扩展是Java虚拟机上NiFi的某些组件。设计

  Apache NiFi的功能:高度可配置,基于Web的用户界面。

  四、Informatica PowerCenter

  Informatica PowerCenter是一个数据集成平台,可帮助加快数据集成项目并迅速将数据交付业务。

  Informatica PowerCenter的功能:用于分析和应用程序的实时数据,可扩展性和零停机时间。

  五、IBM的Infosphere Information Server

  IBM Infosphere Information Server是一个提供大量并行功能的平台。此外,它提供了一个高度灵活且可扩展的平台,能够处理全部数据量,是一个平台,容许用户清理,监视,理解和转换数据。

  Infosphere Information Server的功能:跨各类系统链接数据,评估、分析和监视数据质量。

  六、 Qlik Replicate

  Qlik Replicate是一个数据集成平台,支持多种用例,其中包括实时数据仓库,大型机现代化该平台可自动执行复制过程,其中包括跨全部主要数据库,数据仓库等生成目标架构。

  Qlik Replicate的功能:数据保护,高性能,实时更新,直观的GUI,可复制数据摄取和复制

  七、Oracle Data Integrator

  Oracle Data Integrator是一个平台,可知足从高性能批处理装载到启用SOA的数据服务等几乎全部类型的数据集成需求。包括与Oracle Warehouse Builder到Oracle Data Integrator的互操做性。

  Oracle Data Integrator的功能:快速的开发和维护,数据质量防火墙。

  八、SAP BusinessObjects数据集成器

  借助SAP BusinessObjects Data Integrator,组织能够在分析环境中提取,转换,集成和加载数据。组织能够从几乎任何来源提取数据,进行转换并将其集成到任何目标数据库中。

  SAP的功能:先进的调试功能,数据质量功能。

  九、SAS-数据集成工做室

  SAS用于构建,实施和管理数据集成过程,而与平台,应用程序和数据源无关,是一个功能强大的设计工具。该工做室易于管理,具备多用户环境,能够在大型项目上进行协做。

  SAS功能:提供标准转换库,使您能够查询和使用跨多个系统的数据。郑州不孕不育医院https://jbk.39.net/yiyuanzaixian/zztjyy/

相关文章
相关标签/搜索