机器学习教程之8-机器学习系统的设计(Machine Learning System Design)

0.概述 当数据有类偏斜的现象时,查准率和查全率能更准确的判断算法效果的好坏。 1.首先要做什么 以构建垃圾人邮件分类器算法为例,我们可以做很多事情,例如: (1)收集更多的数据,让我们有更多的垃圾邮件和非垃圾邮件的样本 (2) 基于邮件的路由信息开发一系列复杂的特征 (3) 基于邮件的正文信息开发一系列复杂的特征,包括考虑截词的处理 (4) 为探测刻意的拼写错误(把 watch 写成 w4tch
相关文章
相关标签/搜索