Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。html
Sklearn 主要用Python编写,创建在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提升性能。python
Sklearn 包括六大功能模块:git
分类(Classification):识别样本属于哪一个类别,经常使用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)算法
回归(Regression):预测与对象相关联的连续值属性,经常使用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso网络
聚类(Clustering):对样本进行无监督的自动分类,经常使用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)dom
数据降维(Dimensionality reduction):减小相关变量维数,经常使用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)机器学习
模型选择(Model Selection):比较,验证,选择参数和模型,经常使用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)函数
数据处理 (Preprocessing):特征提取和归一化,经常使用模块有 preprocessing(预处理),feature extraction(特征提取)工具
这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。性能
欢迎关注 Youcans 原创系列,每周更新数模笔记
Python数模笔记-PuLP库
Python数模笔记-StatsModels统计回归
Python数模笔记-Sklearn
Python数模笔记-NetworkX
Python数模笔记-模拟退火算法
官网地址:https://scikit-learn.org/
官方文档中文版: https://www.scikitlearn.com.cn/
内置数据集:https://scikit-learn.org/stable/datasets.html
Sklearn 的安装要求:Python 3.5 以上版本,须要安装 NumPy、SciPy、Pandas 工具包的支持,部份内容须要使用 Matplotlib、joblib 工具包。
pip 安装命令:
pip3 install -U scikit-learn
pip3 install -U scikit-learn -i https://pypi.douban.com/simple
注意 Sklearn 建议安装 Numpy+mkl,能够在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你须要的numpy+mkl版本,下载后 pip3安装:
pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl
Sklearn 内置了一些标准数据集能够用于练习和测试,都是常常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html
Sklearn 标准数据集主要包括:
粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各类算法,而是以典型问题为例来介绍原理简单、使用普遍的基本方法,以便新手入门。
版权说明:
YouCans 原创做品
Copyright 2021 YouCans, XUPT
Crated:2021-05-09
欢迎关注 Youcans 原创系列,每周更新数模笔记
Python数模笔记-PuLP库(1)线性规划入门
Python数模笔记-PuLP库(2)线性规划进阶
Python数模笔记-PuLP库(3)线性规划实例
Python数模笔记-Scipy库(1)线性规划问题
Python数模笔记-StatsModels 统计回归(1)简介
Python数模笔记-StatsModels 统计回归(2)线性回归
Python数模笔记-StatsModels 统计回归(3)模型数据的准备
Python数模笔记-StatsModels 统计回归(4)可视化
Python数模笔记-Sklearn (1)介绍
Python数模笔记-Sklearn (2)聚类分析
Python数模笔记-Sklearn (3)主成分分析
Python数模笔记-Sklearn (4)线性回归
Python数模笔记-Sklearn (5)支持向量机
Python数模笔记-NetworkX(1)图的操做
Python数模笔记-NetworkX(2)最短路径
Python数模笔记-NetworkX(3)条件最短路径
Python数模笔记-模拟退火算法(1)多变量函数优化
Python数模笔记-模拟退火算法(2)约束条件的处理
Python数模笔记-模拟退火算法(3)整数规划问题
Python数模笔记-模拟退火算法(4)旅行商问题