你应该知道的大数据领域12大动向

最近这几周大数据领域可谓动做频频,初创公司和老牌企业都纷纷发布新品,更新或改进现有的产品系列,以及达成战略性关系。数据库

行业观察人士表示,许多企业拿来试点阶段的大数据系统(尤为是那些整合Hadoop平台的系统)后,将它们部署到更普遍的生产环境。本文介绍的新闻主要旨在帮助公司进行这种转型。安全

下面看一下引发咱们关注的12则与大数据有关的动向。其中许多来自近日在加州圣何塞召开的2016年Hadoop峰会。架构

Actian发布VectorH 5.0数据库app

Actian首席营销官托尼·卡瓦诺(Tony Kavanaugh,图左)与Actian合做伙伴销售副总裁戴夫·休格曼(Dave Sugarman)在近期召开的2016年Hadoop峰会上交谈。框架

Actian本周发布了Actian Vector in Hadoop(VectorH)5.0,这是该公司现已与Apache Spark集成起来的SQL-in-Hadoop数据库的新版本。机器学习

与Spark集成起来后,就能够获取来自不一样数据源、采用不一样格式的数据,让开发人员得以利用VectorH,构建高性能数据流、ETL和机器学习等应用程序。随着企业组织将Hadoop分析系统迁移到生产环境,这类功能相当重要。分布式

Actian还大肆宣传VectorH的更高性能,声称性能比像Apache Hive、Cloudera Impala、Apache Spark SQL和Apache HAWQ这些与之竞争的技术更胜一筹,并援引了TPC-H查询基准测试方面的结果。工具

Hortonworks经销AtScale的BI-on-Hadoop软件oop

AtScale开发AtScale智能平台,这让经常使用的业务分析工具得以访问存储在Hadoop集群里面的数据。性能

在Hadoop峰会上,Hadoop软件开发商Hortonworks表示,从今年第三季度开始,它将经销AtScale的软件,做为其围绕Hortonworks数据平台的套装软件解决方案的一部分。

AtScale首席执行官戴夫·马里安尼(Dave Mariani)表示,考虑到Hortonworks的市场地位,这种关系将为AtScale提供一条重要的软件销售渠道。他告诉CRN:“咱们认为,这方面大有潜力带来新业务。”

Attunity发布Visibility For Hadoop系统

Attunity是一家大数据管理软件开发商,它发布了最新版本的Visibility for Hadoop系统,可帮助管理员回答诸如此类的问题:谁在访问Hadoop数据,他们在如何使用数据,以及在此过程当中使用了哪些种类的IT资源。那些答案对于在基于Hadoop的数据湖生产环境里面管理数据增加和工做负载性能来讲相当重要。

新版本提供了更全面的分析功能,可帮助企业组织衡量Hadoop数据和存储使用状况,用于更准确的容量规划、优化成本效益,并知足数据治理和合规要求。新功能支持Hadoop文件系统的存储级别,还支持众多Hadoop数据处理引擎,包括MapReduce、Tez、Hive和Cloudera Impala。

Dataguise DgSecure 6.0

Dataguise发布了新版本的DgSecure软件,这个软件是以数据为中心的安全平台,数据经理和首席信息安全官可使用该平台,管理传统关系数据库和大数据平台中的敏感数据。

DgSecure 6.0与一系列普遍的数据平台和数据源兼容,并支持本地系统和云系统中的结构化数据、半结构化数据和非结构化数据。它提供了数据检测、保护和监控功能,用于数据治理。它还与一系列更普遍的IT和数据管理框架兼容。

新版本还使用内置模板和自定义模板,简化了制定数据治理策略的工做。

Hortonworks发布HDP 2.5预览版

Hortonworks将在今年第三季度发布旗舰Hortonworks数据平台软件的下一个版本,符合该公司在今年初承诺这款基于Apache Hadoop的软件遵照的“快速发布”时间表。

HDP 2.5经过分别支持Apache Ranger和Apche Atlas,增添了该系统的安全功能和治理功能。另外获得支持的还有Apache Zeppelin,这种基于Web的笔记本用于使用SQL、Scala、Python及其余开发语言,建立交互式分析文档。HDP 2.5还与最新版本的Apache Ambari集成起来,用于规划、安装和配置Hadoop系统。

Hortonworks还发布了加强版的Partnerworks合做伙伴计划,添加了一些项目,旨在招募托管服务提供商,并服务于独立软件开发商和独立硬件厂商合做伙伴。

Koverse 2.0加快数据湖的实施

初创公司Koverse提供一种“一体化数据湖”平台;该公司表示,相比目前的技术和方法,有了该平台,就能够大大加快收集大数据、部署到生产环境的速度,并下降成本。

该公司创办于2012年,两年多前开发了早期版本的技术。Koverse平台2.0于6月21日发布,它采用了Apache Accumulo的“分布式键/值存储”技术和该公司的通用索引引擎(Universal Indexing Engine)。

联合创始人保罗·布朗(Paul Brown,首席产品官)和阿伦·科多瓦(Aaron Cordova,首席技术官)曾在美国国家安全局(NSA)从事过数据科学家的工做,他们帮助开发了最初的Accumulo项目,为该部门的数据基础设施从新设计了架构,以便更好地处理意想不到的数据分析情形。如今他们把这一专长带给了Koverse的客户。

Looker更新嵌入式分析工具集

Looker商业智能平台能够访问驻留在数据库中或云端的数据。该公司的Powered by Looker工具让开发人员得以将那些功能嵌入到应用程序中,或者构建具备数据探查和分析功能的自定义应用程序。

本周,该公司更新了Powered by Looker,增添了预制应用程序模板、预制网页和应用程序窗口组件库、加强型API库,以及众多新功能,好比支持Javascript对话,那样更容易把Looker嵌入到应用程序里面。

Pepperdata Hadoop Health Check

Pepperdata开发的软件用于管理和改进Hadoop集群的性能。这家厂商启动了Hadoop Health Check计划;按照该计划,该公司使用软件对至少100个节点组成的Hadoop集群进行补充性评估。该软件能够收集并分析Hadoop性能数据,该公司开发了诊断报告,可准确查出耗用太多IT资源的有问题的用户或任务,识别未获得充分利用的集群资源,并将处理方面的瓶颈标记出来。

Talend发布通过更新的大数据集成平台

Talend发布了新版本的Talend Data Fabric平台,用于集成驻留在本地或云端的数据和应用程序。

新版本的Talend Data Preparation软件是Data Fabric系统的一部分,它为一系列普遍的业务用户提供了加强的自助式数据准备功能,而不是像许多数据准备工具那样将它们局限于一小批熟悉数据的用户。该公司表示,工具集提供了更直观的数据准备功能,还提供了基于角色访问共享式数据存储区的功能。

Talend Data Mapper中的新功能经过更容易地处理庞大数据集,以识别数据模式,找到新的商机,帮助公司更好地发挥公司数据湖的运营价值。Talend Data Fabric还新增了Talend Integration Cloud和亚马逊Redshift中的数据集成任务之间的安全套接层通讯。

Teradata发布支持Presto的技术

企业数据仓库开发商Teradata发布了技术,支持它所发行的来自许多大数据分析软件开发商的Presto SQL-on-Hadoop软件。

Presto最初由Facebook开发,这个开源分布式查询引擎能够针对各个数据源运行交互式查询,包括Apache Hive、Apache Cassandra、 Hadoop分布式文件系统、关系数据库,甚至专有的数据存储系统。Teradata的Presto发行版是这家开发商的Teradata统一数据架构的一部分。

支持Teradata的Presto的软件开发商包括:Tableau、Looker、Information Builders、Qlik和Zoomdata,MicroStrategy和微软正努力认证其商业智能工具,以便与该软件兼容。

Waterline Data软件支持Apache Atlas

Waterline Data开发同名的Smart Data Catalog软件,能够清点数据湖资产,改善数据发现功能,而且让公司更容易从那些资产获取价值。

Smart Data Catalog如今与Apache Atlas这种开源数据治理技术在Hortonworks数据平台里面集成起来。借助Waterline Smart Data Catalog,Apache Atlas用户就能够将人工的元数据标记换成自动化流程,对数据湖资产进行分类,并改善数据治理。

Zoomdata的可视化分析软件支持MapR和Apache Drill

Zoomdata提供一种大数据可视化分析平台,可以实时处理本地环境和云环境中庞大而复杂的查询。

Zoomdata的软件现已经过认证,可与基于Hadoop的 MapR融合数据平台兼容,这两家公司正在展开合做,致力于改进产品整合和支持。

做为此次合做的一方面,Zoomdata表示,它开发了一款“智能链接件”(smart connector),可以以原生方式将其软件与Apache Drill联系起来,后者是一种开源SQL查询引擎,能够访问一大批NoSQL数据库和文件系统中的数据。

相关文章
相关标签/搜索