本文首发自 产品经理的人工智能学习库(easyai.tech)算法
原文地址:《一文看懂逻辑回归算法(基本概念+优缺点+美团应用案例)》机器学习
本文将通俗易懂的介绍逻辑回归的基本概念、优缺点和实际应用的案例。同时会跟线性回归作一些比较,让你们可以有效的区分 2 种不一样的算法。性能
线性回归的位置如上图所示,它属于机器学习 - 监督学习 - 分类 - 逻辑回归。学习
扩展阅读:测试
《一文看懂机器学习!(3种学习方法+7个实操步骤+15种常见算法)》优化
《一文看懂监督学习(基本概念+4步流程+9个典型算法)》人工智能
逻辑回归(Logistic Regression)主要解决二分类问题,用来表示某件事情发生的可能性。3d
好比:cdn
优势:blog
缺点:
线性回归和逻辑回归是 2 种经典的算法。常常被拿来作比较,下面整理了一些二者的区别:
注:
自变量:主动操做的变量,能够看作「因变量」的缘由
因变量:由于「自变量」的变化而变化,能够看作「自变量」的结果。也是咱们想要预测的结果。
美团会把逻辑回归应用到业务中解决一些实际问题。这里以预测用户对品类的购买偏好为例,该问题能够转换为预测用户在将来某个时间段是否会购买某个品类,若是把会购买标记为1,不会购买标记为0,就转换为一个二分类问题。咱们用到的特征包括用户在美团的浏览,购买等历史信息,见下表:
其中提取的特征的时间跨度为30天,标签为2天。生成的训练数据大约在7000万量级(美团一个月有过行为的用户),咱们人工把类似的小品类聚合起来,最后有18个较为典型的品类集合。若是用户在给定的时间内购买某一品类集合,就做为正例。有了训练数据后,使用Spark版的LR算法对每一个品类训练一个二分类模型,迭代次数设为100次的话模型训练须要40分钟左右,平均每一个模型2分钟,测试集上的AUC也大多在0.8以上。训练好的模型会保存下来,用于预测在各个品类上的购买几率。预测的结果则会用于推荐等场景。
因为不一样品类之间正负例分布不一样,有些品类正负例分布很不均衡,咱们还尝试了不一样的采样方法,最终目标是提升下单率等线上指标。通过一些参数调优,品类偏好特征为推荐和排序带来了超过1%的下单率提高。
此外,因为LR模型的简单高效,易于实现,能够为后续模型优化提供一个不错的baseline,咱们在排序等服务中也使用了LR模型。