拼多多面经

一面 自我介绍 聊项目 说一种你熟悉的模型 如何在一个大数据量的状况下 设计一个cache 好比用户搜索请求数据库 不反复从数据库里读 二面 自我介绍 聊项目 GBDT的实现,xgboost的实现,二者的差异 xgboost为何要二阶泰勒展开 如何选取样本,正负样本不均匀的状况下怎么处理,为何不均匀会很差 如何洗数据 特征的选择 如何选择模型 随机森林为何能够防止过拟合 数据为何要分片 xgboo
相关文章
相关标签/搜索