基于spark logicplan的表血缘关系解析实现

      随着公司平台用户数量与表数量的不断增多,各类表之间的数据流向也变得更加复杂,特别是某个任务中会对源表读取并进行一系列复杂的变换后又生成新的数据表,所以须要一套表血缘关系解析机制能清晰地解析出每一个任务所造成的表血缘关系链。java       实现思路:python       spark对sql的操做会造成一个dataframe,dataframe中的logicplan包含了sql的
相关文章
相关标签/搜索