Pyspark+tensorflow-信用贷款数据分析实战(三)——数据提取

3.数据提取 目的:建立因果关系模型 数据提取的时候要对数据有一定的认识,不能是相关而应该是因果(区分相关关系和因果关系),预测的变量x要在被预测变量y之前取得 相关关系:一个小孩子身高的长高速度和GDP增长的速度就可以做相关关系,但这明显没有什么关系。 因果关系:家庭收入和全国GDP总量,这就明显具有一定的因果关系。 细分了特征变量之后,就有了下面的模型框架: 观察窗口(历史)看解释变量: 如果
相关文章
相关标签/搜索