

指没法在必定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是须要新处理模式才能具备更强的决策力、洞察发现力,和流程优化能力的海量、高增加率和多样化的信息资产。主要解决海量数据的存储和海量数据的分析计算问题。html
大数据有4个特色,分别为:Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值),通常咱们称之为4V。java
大量。大数据的特征首先就体现为“大”,随着信息技术的高速发展,数据开始爆发性增加。存储单位从过去的GB到TB,乃至如今的PB、EB级别,迫切须要智能的算法、强大的数据处理平台和新的数据处理技术,来统计、分析、预测和实时处理如此大规模的数据。web
多样。普遍的数据来源,不少平台都会经过对用户的日志数据进行分析,从而进一步推荐用户喜欢的东西。日志数据是结构化明显的数据,还有一些数据结构化不明显,例如图片、音频、视频等,这些数据因果关系弱,就须要人工对其进行标注。应用最普遍的就是推荐系统
算法
高速。大数据的产生很是迅速,主要经过互联网传输。生活中每一个人都离不开互联网,也就是说天天我的天天都在向大数据提供大量的资料。服务器中大量的资源都用于处理和计算数据,不少平台都须要作到实时分析。数据无时无刻不在产生,谁的速度更快,谁就有优点。
服务器
价值。这也是大数据的核心特征。大数据最大的价值在于经过从大量不相关的各类类型的数据中,挖掘出对将来趋势与模式预测分析有价值的数据,并经过机器学习方法、人工智能方法或数据挖掘方法深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提升生产效率、推动科学研究的效果。
微信
有人说北京毕竟是一线城市,那咱们来看个二线城市:

喜欢的话,点个关注,分享一下吧!
数据结构
本文分享自微信公众号 - 跟我一块儿学大数据(java_big_data)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。机器学习