Spark Streaming的背压机制(类比Storm雪崩)

       默认状况下,SparkStremaing根据Receiver以生产者生产数据的速度来接收数据,可是在工做状态下, 实际计算一个批次数据的时间通常要大于Streaming应用设置的批处理间隔。这就意味着Spark Streaming处理数据的速度要小于数据接收的速度, 数据处理能力低,致使数据所有堆积在内存中,进一步致使Receiver所在的Executor会发生内存溢出的问题。   
相关文章
相关标签/搜索