Kaggle学习(一)产品和搜索词语相关性自动评价

测试集输入到模型中输出评价和实际评价相比较 评分标准: 原先是2被评价成1的有100个,被评价成2的有200个 为什么这么设置: 提交几百万次———— 限制提交次数 最好的情况 冠军思路 去掉html标签,拼写错误的单词/同义词替换掉,Stemming(统计词的原型,比如动词和形容词统一成名词,复数统一成单数) **组合提升:**弱分类器——强分类器 无免费午餐定理 模型是已经做好了的 http:
相关文章
相关标签/搜索