1.什么是SVD :
SVD指的是奇异值分解 SVD SVD的物理意义app
2.利用Python实现SVD机器学习
from numpy import linalg as la # Numpy有一个称为linalg的线性代数工具,其中svd计算方法以下 U,Sigma,VT = la.svd(dataMat)
3.利用SVD提升效率
生产实际中的数据比较稀疏,在生产中无论是基于用户的类似度计算仍是基于物品的类似度计算
都须要较多的时间和不少的计算力,经过SVD能够将映射到低纬空间中去工具
4.基于SVD的评估方法Python实现(参考自机器学习实战)学习
def svdEst(dataMat, user, simMeas, item): n = shape(dataMat)[1] simTotal = 0.0; ratSimTotal = 0.0 U,Sigma,VT = la.svd(dataMat)# numpy 的svd计算 Sig4 = mat(eye(4)*Sigma[:4]) #numpy.eye() 生成对角矩阵 # 机器学习实战的P264中代码对应的公式推导 https://blog.csdn.net/appleyuchi/article/details/82913217 xformedItems = dataMat.T * U[:,:4] * Sig4.I for j in range(n): userRating = dataMat[user,j] if userRating == 0 or j==item: continue similarity = simMeas(xformedItems[item,:].T,\ xformedItems[j,:].T) print 'the %d and %d similarity is: %f' % (item, j, similarity) simTotal += similarity ratSimTotal += similarity * userRating if simTotal == 0: return 0 else: return ratSimTotal/simTotal
其中计算按照奇异值能到达总能量的90% 计算;dataMat.T U[:,:4] Sig4.I 的推导请参见:推导.net