Day12

1.今天的学习过程和小结:mysql

开发项目,经过分析日志用户画像描绘sql

数据清洗,第一阶段:把须要的信息从原始日志中提取出来,第二阶段:根据提取出来的信息作精细化操做框架

数据处理,按照咱们的须要进行相应业务的统计和分析 spark、Hive、MapReduce或其余的一些分布式计算框架分布式

处理结果入库,结果能够存放到mysql学习

数据的可视化,经过图形化展现的方式展示出来:饼图、柱状图、地图、折线图 Echarts、HUE、zeppelinspa

 

2.遇到的问题:日志

数据清洗的时候,屡次出现下标越界的问题,主要缘由是对数据的格式把握不许确,有许多未预料到的数据出现blog

mapreduce编写不熟练开发

 

3.思惟导图spark

相关文章
相关标签/搜索