基于XGBoost的句子相似度匹配

  问题的定义 项目概述 本项目将会是自然语言处理相关方法的实践,数据集是Kaggle上关于句子相似度匹配的竞赛。涉及到文本类信息的数据清洗和特征工程,在模型方法上将会使用XGBoost。XGBosst方法是一类集成方法,将多个弱分类器集成为一个强大的模型。鉴于本次项目竞赛已经结束,所以最终的训练效果无从验证,本项目重点讨论文本特征的提取和XGBoost模型如何使用及调参。 问题陈述 本项目是一个
相关文章
相关标签/搜索