前言 WHY?AI是从策略出发,简单可描述(能够用清晰的规则和算法取实现)的任务,让机器去执行。咱们但愿复杂难以描述的任务(如无人驾驶,语音识别等状况复杂,须要推理和抽象化的任务)也能够由机器去实现,ML/DL是从数据驱动出发。数据挖掘、模式识别、机器学习和神经网络都是用来解决这些复杂的状况下的任务(几者之间互相联系,相关关联,甚至区别不大)。html
1、模式识别算法
解决问题:如何让机器作与人感知相关的任务?认知模型、区分模式,从而造成正确的判决(聚类与系统推荐)网络
①类人的观察②感知环境中感兴趣的部分(特征抽取与整合)③做出与人推理相近的判决。app
举例:如何区分两种鱼?机器学习
典型的决策机制函数
特征选择学习
咱们知道两种鱼的长度通常不同,能够做为区分的特征,须要选择长度的阈值,同时,咱们也能够看到通常鱼的长度是不同,可是并非严格不一样,即长度不能彻底区分两种鱼,此时咱们考虑尝试其余的特征。机器学习中①并不存在单一特征能够区分类别,采用多个特征进行组合分析(整个状况就更加复杂)②假定各个特征之间独立,尽量选择特征之间互相独立的特征(避免相关性,可是每每实际中,特征之间是相关的,如身高和体重),尽量考虑多的特征。
大数据
特征维数变多出现的问题:一是模型更加复杂(容易过拟合)。二是学习的效率降低。spa
指望提取的特征:可以区分类别,选择好的特征可以正确区分类别(差的特征可能没法区别类别)3d
特征提取的方法有两种:一种是Feature extraction 即特征映射?经过函数映射到新的特征空间,新的特征空间采用矢量表示特征,能够体现或者容易比较二者(二者只类别仍是特征之间呢?)之间的相关性。另外一种是特征选择,在若干特征中选择一部分。
tradeoff:依据判别结果所付出的代价对模型进行调整(例如:salmon的价格高于sea bass时,咱们把分类曲线往左移,那么对于salmon的判断基本不会出错,不会发生顾客用高价钱买到的倒是sea bass,不会有上当受骗的嫌疑。有可能使用低价钱买到salmon(salmon被断定为sea bass时),这个时候顾客就会很高兴,下次会继续过来这里买鱼,即咱们但愿salmon的正确率必定要保证)
模型好坏的度量:
(ROC与AUC?)
2、机器学习
机器能够替代人的技能
机器学习是使用大量数据去学习模型。机器考虑特征与结果的相关性比人要好,人能够考虑影响结果的2到3个特征,机器能够考虑不少个影响因素。
为何用机器学习?从特定的样例中学习数据的通常模型,数据丰富且便宜,知识少而昂贵。创建一个模型去很好而且有效的近似数据
机器学习模型:
一、监督学习(决策树、前向神经网络和反向传播) 有监督模型的优势是提供标签,准确率高。
二、无监督学习(聚类、关联分析) 无监督学习不须要标签,因此数据数量能够很大很大,优势是适用大数据。
三、Reinforcement learning http://www.cse.unsw.edu.au/~cs9417ml/RL1/applet.html
机器学习的输出:
3、神经网络
神经元
神经网络
神经网路主要是学习权重,怎么样获得好的权重去完成任务(怎么修改权重?谁先改?)。生物依据,只是概念上同样,功能上并不一样。同一层之间不相链接,彼此之间改变互不影响,模型简单。隐藏层(hidden):咱们不能肯定它应该输出是怎么样,不能预测它真实的输出。输入和输出是能够获得预测的输入与输出,而且能够与真实的输出进行对比。
Why Deep Learning?
Deep Learning能够经过input对每一层学习获得的进行解释,隐藏层能够解释(如某一层表示边缘,即每一层都有必定的归结,DL每每每一层能够表示出来,区分DL与传统NN的区别)
区别与关系
原来知道哪些特征好,就用那些特征,如今不知道,让它本身学习哪些特征好(特征 → 学习新的特征)。