logistics regression

logistics regression用于解决一些二分类问题。好比(纯假设)网上购物时,网站会判断一我的退货的可能性有多大,若是该用户退货的可能性很大,那么网站就不会推荐改用户购买退费险。反之,若是该用户退货的可能性不大,则能够推荐该用户购买退费险。好比以下数据:算法

历史该类目退货率,性别,年龄,商品价格,是否新注册用户,商品类别,    发生退货
0.5                        ,0     ,20   , 300        ,0                       ,8            ,     1
0.3                        ,1     ,30   , 50          ,0                       ,5            ,      0

假设以上数据是电商网站总结的一些用户购买行为数据,最后一列是这些数据对应的,用户退货的状况。那么利用logistics regression来解决这类问题就是说,用历史数据带入logistics regression来获得一个模型,这个模型应该可以很好的拟合历史数据,也就是输入上述数据的前6列,可以得出一个结果。这个结果应该和第七列相符合。这样,当出现一个新的数据时,电商网站能够根据模型判断这个数据对应的退货可能性。函数

为了简化表述,咱们把数据抽象成下面的矩阵形式网站

x11,x12,x13 ... x1n        y1
x21,x22,x23 ... x2n        y2
...
xm1,xm2,xm3 ... xmn    ym

在logistics中,采用的数学模型叫sigmod函数。code

y = 1 / [ 1 + e (-z)]
z = w0*xi0 + w1*xi1 + w2*xi2 + ... wn*xin

注意, x原本只有n个属性,可是在算法中咱们加上了一个x0这个属性,一般为1. w 是一个和x维度同样的多维向量。 在logistics regression中,咱们认为存在一个向量w,把它带入sigmod函数后可以得出一个较准确的类别y.数学

相关文章
相关标签/搜索