问题来了,大数据的特性究竟有多少个V?

—— 原文发布于本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),欢迎关注。微信

 

一提到大数据的特性,不少人立刻就会想到3V、4V,那么大数据究竟有多少个V呢?架构

在大数据的不断发展阶段,业界对大数据的特征认识也在逐步完善,涵盖范围也更加全面。大数据

 

一、3V人工智能

2001年麦塔集团(META Group)分析师莱尼在一份报告中对大数据提出了“3D数据管理”的观点,即认为大数据将往高速、多样、海量3个方向发展,提出了3个特性:高速性(Velocity)、多样化(Variety)、规模化(Volume),统称3V。设计

3V特性是大数据最具表明性的特性,被麦肯锡、IBM、微软等多家公司所承认并不断在大数据报告中说起。IDC(International Data Corporation,国际数据公司)在给大数据下定义时即是引用了3V的特性:“大数据技术是新一代的技术与架构,它被设计用于在成本可承受的条件下,经过很是快速(velocity)的采集、发现和分析,从大致量(volumes)、多类别(variety)的数据中提取价值”。ci

 

二、4Vit

4V也是广受承认的大数据特性,在3V的基础上再加上了价值(Value)的维度,主要强调大数据的整体价值大,但价值密度低。io

规模性(Volume)、多样性(Varity)、高速性(Velocity)和价值性(Value),合称“4V”。基础

另外,还有一种大数据观点是“4V+1O”,在4V的基础上再加上1个O,即数据在线(Online),强调数据永远在线,能随时调用和计算,这也是有别于传统数据的特性之一。引用

 

三、5V、6V、7V、8V

随着大数据技术的不断发展,数据的复杂程度越来越高,不断有人提出了大数据特征新的论断,在4V的基础上增长了准确性(Veracity),强调有意义的数据必须真实、准确;增长了动态性(Vitality),强调整个数据体系的动态性;增长了可视性(Visualization),强调数据的显性化展示;增长了合法性(Validity),强调数据采集和应用的合法性,特别是对于我的隐私数据的合理使用。

 

下图展示了3V到8V的特性图

 

欢迎关注本人的微信公众号“大数据与人工智能Lab”(BigdataAILab),获取更多资讯