算法学习笔记----Day25(机器学习导论)

今日学习 第一部分:大数据时代 一.大数据的4V特征 数据量大; 数据种类多:结构化数据(mysql)、非结构化数据(图像、音频)、半结构化数据(xml、html); 速度快:数据的增长速度快、处理速度快; 价值密度低:价值高,数据总量大,需要机器学习算法解决问题。 二.大数据项目架构 数据采集层:ftp、socket方式 数据存储层:HDFS 数据分析层:MR\Hive\Impala\Spark
相关文章
相关标签/搜索