sparkstreaming的执行流程

sparkstreaming是准实时处理框架(微批处理:能够设置时间间隔) 框架 经过上图总结:分布式     receiver task 是 7*24h一直在执行,一直接收数据,将接受到的数据保存到batch(该一批次的时间间隔bacth interval是本身写的,本例中是5s即batch interval=5s)中,那么就把接收到的数据每隔5s切割刀一个batch中,由于batch是没有分布
相关文章
相关标签/搜索