机器学习笔记(十一) 机器学习系统的设计

1.工作的优先级    以垃圾邮件分类器算法为例进行讨论:    为了解决问题,我们首先要决定如何表达特征向量 x。选择一个由 100 个最常出现在垃圾邮件中的词所构成的列表,根据这些词是否有在邮件中出现(出现为 1,不出现为 0),获得特征向量。    为了构建这个分类器算法,我们可以:    (1)收集更多的数据,有更多的垃圾邮件和非垃圾邮件的样本;    (2)开发一系列复杂的特征;    
相关文章
相关标签/搜索