每一个SaaS应用程序背后的数据库存储有关员工、供应商、客户及其余合做伙伴的业务信息。SaaS应用程序支持诸多工做流程,好比面向销售和营销的CRM、面向财务的云ERP、面向人力资源的劳动力管理以及其余企业和部门服务。现在,许多公司使用众多SaaS应用程序:从Salesforce、Slack、Workday和Atlassian之类的主流产品,到许多小型的SaaS工具,不一而足。
如何从SaaS应用程序查询和提取数据?
SaaS应用程序不会在孤岛中运行,大多数企业须要将它们的功能与私有云或公共云中管理的其余企业应用程序集成起来。
若是跨多个应用程序的工做流程须要集成应用程序,开发团队能够利用SaaS平台的API来触发从一个平台到另外一个平台的事件。许多应用程序和服务须要集成时,能够选择Boomi、SnapLogic或MuleSoft之类的企业集成平台。若是须要遵循“若是这样,须要那样”模式的轻量级集成,IFTTT平台能够提供有效的集成。若是开发团队在开发链接到多个SaaS和企业工做流程的新应用程序,还应探究Appian、OutSystems和PowWow之类的低代码平台。
利用SaaS数据以知足不一样的业务需求
若是你须要未来自SaaS平台的数据与其余数据源集成起来怎么办?可能须要跨SaaS工具集成数据,出于这几个缘由:
业务分析员想使用该数据来开发报告和仪表板。
数据科学团队想要用于机器学习实验的数据。
业务团队想要集中数据以支持工做流程及其余类型的应用程序。好比说,营销团队经常使用客户数据平台或主数据平台来集中有关客户、产品和其余业务实体的数据。
IT团队应提取备份所需的数据,或将数据迁移到其余平台。
法务团队有时须要对基础数据执行法律发现。
数据管理员经常想要清理、转换或丰富基础数据。
固然,你能够利用SaaS平台的API来提取数据,但这可能须要大量的开发工做来学习API、了解SaaS平台的数据模型、为任何新数据建立数据存储区、编写代码以加载数据,并为任何转换开发逻辑。此外,IT团队要定义托管该应用程序或服务的云或数据中心基础架构。最后,任何旨在按计划或按须要运行的数据集成都须要平常的支持。对于面临其余更重要的优先事项的开发团队和IT部门而言,从头开始开发集成可能成本高昂。
另外一种方法是考虑数据集成、数据流、ETL(提取转换和加载)或其余数据准备平台。处理频繁变化的大量数据时,使用数据集成平台多是最佳方法,由于这种平台可实现灵活的提取和转换。然而,在最终用户访问和使用信息以前,它们也须要事先开发集成机制。
可能须要查询和管理SaaS数据的更轻量级的手段。有时,这种方法对于快速实验、发现和构建原型颇有用。有时,这种方法能够轻松用于运营或生产需求,尤为在数据量不多且查询吞吐量不大的状况下。如下是三种选择。数据库
- 直接查询SaaS应用程序的BI平台
若是你的主要需求是报告,那么许多自助式BI和数据可视化平台能够直接链接到更流行的SaaS应用程序。
Tableau能够链接到Intuit Quickbook、Google Analytics、LinkedIn Sales Navigator、ServiceNow、Eloqua、Marketo和Salesforce等平台。
Microsoft Power BI还与Adobe Analytics、Facebook、GitHub、MailChimp、Stripe、Quick Base和Zendesk等在线服务集成。
Domo声称有1000多个链接件,支持的平台包括HubSpot、Jira、Instagram、Qualtrics、Shopify、SurveyMonkey、Twitter和Workday等。
至少,这些集成提供了一种查询和发现基础SaaS数据源的简易方法。往好里说,现成的集成足以使最终用户建立所需的数据混合、报告和仪表板。
有几个方面要考虑。
当列有匹配的键时,这些平台可支持链接和数据混合。若是在集成数据源或将其与其余数据源混合以前须要大量的数据转换,它们就变得较难使用。
评估是否经过实时查询执行SaaS数据集成,或者数据是提取仍是缓存。
若是SaaS应用程序含有大量数据、与许多其余数据源存在复杂的链接,或者仪表板将被许多用户同时使用,性能多是一个因素。
- 模拟ODBC、JDBC、OData或其余驱动程序的平台
若是业务须要的不只仅是报告和仪表板,仍须要轻量级的集成方法,那么一些商业工具可将SaaS API转换成标准数据库驱动程序,好比ODBC、JDBC或OData。对于经常使用SaaS平台的驱动程序而言,两个选择是Progress DataDirect和CData Driver Technologies。
若是数据科学团队想要在提取数据以供分析以前对SaaS数据库执行临时查询,驱动程序方法可能最有用。对于须要实时查询SaaS应用程序数据的应用开发人员来讲,这也是不错的选择。
开发和数据科学团队应调查该集成的性能,尤为是在须要大量查询、庞大数据集或低延迟的状况下。此外,许多SaaS应用程序根据API使用状况来限制客户或向客户收费,所以若是须要更高的查询量或数据量,这多是个因素。
- 可将SaaS数据同步到云数据库的轻量级ETL平台最后一个方法是将数据集成从SaaS应用程序搬到贵企业创建和管理的云数据库中。该策略增添了一些操做复杂性和成本,若是须要实时查询SaaS应用程序数据,可能不是理想的选择。但它确实有几个优势:它让企业能够更大程度地控制业务用户、数据科学家(包括平民数据科学家)和应用开发人员使用的数据库平台和数据架构。平台和架构应知足容量、性能和延迟等方面的要求。独立于SaaS数据库存储数据可提供更大的灵活性,可根据下游用户和应用程序的要求,灵活地转换、链接、清理或聚合数据。若是面向查询该数据的数据安全、数据隐私或其余数据治理控制措施有别于SaaS应用程序中的访问和权利控制措施,那么可能须要将数据托管在单独的数据库中。独立于SaaS平台托管数据对于更高的数据量和查询量需求而言可能更具成本效益。虽然你能够将该集成与数据集成或准备平台结合起来,可是仍有一些SaaS数据集成平台拥有可直接链接到许多SaaS应用程序的机制。若是你的目标是将数据从SaaS应用程序流式传输到云数据库,Talend旗下的Stitch是一款即插即用的解决方案。你能够选择要复制的数据和复制频次,可是它不提供用于转换或过滤数据的任何工具。Skyvia提供了一款相似的产品,二者都有让开发团队能够试一试集成的免费版本。谷歌云旗下的Alooma致力于将数据转移至Google BigQuery、Amazon Redshift和Snowflake之类的大数据平台,并提供一些数据转换功能。若是贵公司在使用许多SaaS平台,那么一刀切的策略可能行不通。每条集成路径都支持不一样的SaaS集成,集成的类型必须与预期的业务需求相一致。比较工具并考虑多种选择是一条优选实践,数据集成需求变化时尤其如此。