数据与挖掘 笔记3

1.标准化的方法 第一种 有上下限 比如最高的98000与最低的12000,定义73600为(0,1)之间的一个值的公式。 第二种 无限,计算偏离值的方法。 2.描述数据的方式 平均数,中位数(用的较多),高频数,方差:即Var(x) 3.A与B是否相关? 值得注意的是,当=0时,并不意味着无关,只是不呈线性相关。 叉状表格,调查象棋与读书的相关性,红色框内是 本应该有的(expected)人数和
相关文章
相关标签/搜索