前述知识见二值变量间的相关性分析html
dc系数,这里做者是用本身名字命名,也是区分度相关系数的一个缩写。spa
关于dc系数的表达式咱们能够使用以下的表达式,该表达式要比第一个表达式更优。由于区分度d其实是一个平方项,开发以后的sqrt(d)能更好的刻画区分度,因此dc系数为:htm
即咱们用新的区分度sqrt(d)来代替以前的区分度d。blog
一样的数据运行结果为:开发