自定义udf函数的使用

自定义udf函数的使用 新建df1 和 df2 两个数据源,指定数据源的中的列名和列的类型。用相同列“chanel_id”做关联,进行join outer查询, 在select取值的时候,用自定义的udf函数(get_channel_id),取两个表中不为空的“channel_id”作为结果集的数据。 用fillna 替换结果集中的null值 from pyspark.sql.functions
相关文章
相关标签/搜索