scipy.sparse模块解决稀疏矩阵的存储问题

最近在做腾讯算法广告大赛,样本数高达1100多W,这个时候用numpy矩阵存储特征向量会出现memory error,而且特征本身是稀疏的,也就是大部分元素都为0。查了一些资料后发现scipy库中的sparse模块能很好的解决这个问题,先附上scipy.sparse的文档网址:https://docs.scipy.org/doc/scipy/reference/sparse.html。 稀疏矩阵:
相关文章
相关标签/搜索