spark大数据分析实战案列1学习 (lamda架构日志分析流水线)

日志实例格式 算法 当数据量较小(10MB,100MB,10GB)能够经过Shell Python单机解决sql Linux Shell命令 :  cat access.log.10 |awk '{a[$1]++} END {for(b in a) print b"\t"a[b]} 架构 '| sort -k2 -r |head -n 10spa    日志分析指标:3d   
相关文章
相关标签/搜索