十大机器学习算法的优缺点及选择依据

C4.5算法 C4.5算法的核心思想是ID3算法,是ID3算法的改进: 用信息增益率来选择属性,克服了用信息增益来选择属性时变相选择取值多的属性的不足; 在树的构造过程中进行剪枝; 能处理非离散化数据; 能处理不完整数据。 优点: 产生的分类规则易于理解,准确率高。 缺点: 在构造过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效; C4.5算法只适合于能够驻留内存的数据集,当训练集
相关文章
相关标签/搜索