Spark Streaming foreachRDD的正确使用方式

误区一:在driver上建立链接对象(好比网络链接或数据库链接) 若是在driver上建立链接对象,而后在RDD的算子函数内使用链接对象,那么就意味着须要将链接对象序列化后从driver传递到worker上。而链接对象(好比Connection对象)一般来讲是不支持序列化的,此时一般会报序列化的异常(serialization errors)。所以链接对象必须在worker上建立,不要在drive
相关文章
相关标签/搜索