机器学习学习笔记1-初识机器学习

导语：

以前有作过一些简单的跟机器学习相关的一些小玩意，好比OCR识别，车牌识别的东西，不过没有系统话的学习过机器学习，最近打算系统的看看学一学。这个是看吴恩达的机器学习的学习笔记的记录。学习地址算法

什么是机器学习 Machine Learning：

视频中介绍了两位机器学习专家给出的机器学习的定义： 1.Artthur Samuel(1959年).Machine Learning：Field of study that give computers the ability to learn without being explicitly programmed. 在某个领域，使计算机无需明确编程便可学会某项技能。 2.Tom Mitchell（1998）.Well-posed Learning Problem：A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E. 适定的学习问题：若是某计算机程序在T上的性能（由P衡量）随经验E的提升而提升，则该计算机程序能够从经验E中学习一些任务T和一些绩效指标P。 ps：感受这两个说法虽然看起来不一样，可是确实在说同一件事件。第二个说法更加具体，我本身的理解就是让计算机通过训练，能完成某种特定场景的任务。编程

监督学习 Supervised Learning：

In supervised learning, we are given a data set and already know what our correct output should look like, having the idea that there is a relationship between the input an d the output. Supervised learning problems are categorized into "regression" and "classification" problems. In a regression problem, we are trying to predict results within a continuous output, meaning that we are trying to map input variables to some cont inuous function. In a classification problem, we are instead trying to predict results in a discrete output. In other words, we are trying to map input variables into discrete categories. 在监督学习中，咱们获得了一个数据集，而且已经知道咱们的正确输出应该是什么样子，并认为输入与输出之间存在关系。监督学习问题分为“回归”和“分类”问题。在回归问题中，咱们试图预测连续输出中的结果，这意味着咱们试图将输入变量映射到某些连续函数。在分类问题中，咱们改成尝试预测离散输出中的结果。换句话说，咱们正在尝试将输入变量映射为离散类别。 ps：文中用预测房价的走向举了一个例子，仍是比较好理解的，至关于某些事情是有一个内在的规律，好比房价预测就是一个一元二次的方程，x是房屋面积，y是价格，而后经过不断的输入数据来找寻这个x的系数和指数是多少，完成这个公式以后就能够用这个公式去预测其余面积x对应的房价是多少。之因此被称为监督学习，是人要给计算器提供正确的答案，引导计算机往人类想要的结果的方向去学习。markdown

无监督学习 Unsupervised Learning：

Unsupervised learning allows us to approach problems with little or no idea what our results should look like. We can derive structure from data where we don't necessarily know the effect of the variables. We can derive this structure by clustering the data based on relationships among the variables in the data. With unsupervised learning there is no feedback based on the prediction results. 无监督学习使咱们几乎或根本不了解结果应该是什么样的状况下解决问题。咱们能够从没必要知道变量影响的数据中得出结构。咱们能够经过基于数据中变量之间的关系对数据进行聚类来推导此结构。在无监督学习的状况下，没有基于预测结果的反馈。 ps：无监督学习纯属计算机本身去学习的一个过程，人类不用给出正确或错误的答案，程序自动分析数据的相同和不一样点作分类，把它们区分开来，比较经常使用的就有聚类算法。app

总结：

吴恩达的教程是英文的可是有双语字幕，并非很难懂，还有PPT能够下载，应该对像我这样的初学者仍是很友好的。结合着周志华的西瓜书对照着看下仍是颇有帮助的。但愿后面把这个专题学完写完能对人工智能有个新的认识也能写点小项目。中美将来这些年确定是要相互竞争的，美国但愿中国放弃高科技产业，包括人工智能，这反而激起了想学习人工智能的热情，虽然本质工做不是干这个的，不过多学学总有好处。机器学习