pyspark、hive和dateframe临时udf使用案例

背景         在我们数据开发过程中业务中有很多计算时间差值的场景,公司业务数据时间格式基本是:yyyyMMdd,,而spark或者hive提供内置函数datediff(),需要传入的时间参数格式:yyyy-MM-dd,为开发时简化代码量与代码可读性,我们通过创建临时udf可以灵活的解决该问题。 pyspark import time def dd_datediff(date_now, da
相关文章
相关标签/搜索