《machine learning》11 机器学习系统的设计

11.1 邮件分类实例 监督学习supervised learning:x = 邮件的特征 ,y = 标签1或0(是否为垃圾邮件) 特征features x: 选择100个出现频率最高的单词。例如 deal,now…更可能是非垃圾邮件 提取特征单词,按字典排序,特征向量为0/1,判断特征单词是否出现 如何快速的使邮件分类器有低误差: 收集更多数据 使用更复杂的特征变量描述邮件 (发件人、地址…)
相关文章
相关标签/搜索