属性相关分析方法:算法
首先,个人读后感是,对这一系列我感到比较困惑,不过,若是遇到实际问题的时候,只能按照例子,照搬步骤来分析。可是我初步理解到,按照下面的操做,是经过信息量,来分出个属性的主次,以便消除弱相关属性,并得到初始工做数据集。数据库
这是一个基于信息(熵)进行属性相关分析的基本内容。.net
事例3.7:假设须要利用分析定性描述概括方法,从一个大学数据库挖掘研究生的概念定性描述。ip
(1) 创建研究生目标数据集合。get
(2) 利用AOI方法,根据属性泛化控制阙值对目标数据集所包含的属性进行初步分析。消除取值过多的属性并进行小规模属性泛化操做。从而得到3.5的结果。it
(3) 用属性相关分析方法。首先是利用公式3.4计算当前数据进行分类所须要的信息量:io
再用公式3.5 计算若利用major属性对数据进行分支所须要的信息为:cli
(4) 消除弱相关属性,并得到初始工做数据集。方法
(5) 最后利用算法3.1进行基于属性的概括,并得到研究生目标数据集的概念描述。im
基于属性概括结果的表示
AOI方法的挖掘结果能够有多种输出表示形式。利用基于属性概括所得到的挖掘结果一般都是采用如表-3.2所示的表格形式来加以描述。如下就是这样描述AOI方法挖掘结果的事例。
示例3.3:假设基于属性概括操做是在一个商场数据库(2000年销售额)中进行的,从而得到如表-3.3所示的(泛化)概括结果。
对上述概括结果,咱们能够转换成棒图表示描述
分析定性描述事例
若所挖掘的概念秒速涉及许多属性,就须要对分析定性描述挖掘(analytical characterization)