大白话5分钟带你走进人工智能-第二十二节决策树系列之概念介绍(1)

                                                            第二十二节决策树系列之概念介绍(1)面试

本系列咱们讲一个新算法及其衍生出来的系列算法,决策树,随机森林以及集成学习。不管是线性回归,逻辑回归,SVM,最大熵模型也好,都是w作参数,而咱们的最终结果不管须要预测仍是要分类,都是把x跟w互相搞一搞,而后得出一个结果。咱们的y是经过x跟本身学的参数计算出来的,而决策树是经过一个树形的结构,来把咱们的预测和分类问题完成。算法

决策树既能作预测也能作分类,它本质上最直观的是用来作分类,可是经过一点点的调整也能够用来作预测。决策树的起源很是早,所谓最先时期的人工智能就是指这。编程

好比拿下棋举例,第1节点表示对方走了一步棋,而后再走一步棋,走到2这个节点,当走到4这个节点的时候,有可能再走回1这个节点。每个节点之间连线表明一个状态,这个状态也叫有限状态机所谓的有限状态机就是指就有若干的状态,每一个状态之间能够互相转换。app

好比说对方第一步走的是第一种状态,你就作出一个决策,对方第二步走到另一个状态,你就跳到另外一个决策,在早期的游戏AI里面一般都是用这种方式来作。它背后都是一个有限状态机,看到你作了什么状况,就跑到某一个状态去执行一个决策,发现你又变成另外一个状态,它有可能跳回原来那个状态去执行以前的决策,因此它是根据不一样的形式评估,而后在不一样的状态之间跳转,有不一样的策略执行。每个状态其实都有多是一个子函数,背后取作一系列的操做。当有限状态机设计的特别复杂的时候,必定程度上它就具有必定的智能。机器学习

因此那个时代里所谓的人工智能就是发现对方往前走了,下一步应该作什么?背后其是一系列特别复杂的策略写的程序存到计算机里面,就至关于在编写这个程序的时候,你替计算机想到了全部一切可能发生的状况,告诉它遇到什么状况就干什么,因此看起来像是在模仿人类作决策的过程,其实背后就是一堆的if else。函数

因此人工智能里面有一句笑话叫有多少人工就有多少智能,在那个时代说的确实对,人想到了多少事,计算机只是帮你记下来,遇到这个状况的时候,去执行这个程序,这个就叫显示编程学习

而机器学习推翻了那种思路,它想经过不须要你显示编程的方式,让计算机从数据集中经过某些合理的算法,本身大量计算后,获得一些信息。ui

简单来讲,人工智能主要解决两个问题,一是决策问题,就是全部数据给你以后,你应该作什么?大部分数据挖掘就是作这件事情,帮人们作一些决策。二是识别问题,把天然界中没有整理好的数据及丢给计算机,让它能认识这个东西是什么,好比图像识别,语音识别,好比天然语音处理。人工智能

决策和识别哪一个更复杂一点?识别,让计算机理解人才能理解的东西更复杂。它的几个分支,一个是CV计算机视觉,一个是NLP天然语言处理,好比咱们积累了大量的数据在移动互联网里,那么这些数据是未经处理的,怎么样从中提取信息,基本上是天然语言处理要作的事。spa

可是各个分支不会是本身独立的一部分,作决策也须要这些支撑。好比阿里天气竞赛有一个健康绿色的比赛,它里面要根据几万我的的体检报告给参赛者,去评估人的血压血脂各类指标。那里面不少数据的维度并非整理好的数据,而是x1到xn是一组数,不少给你的原始数据是医生写的评语。那么在作数据预处理的时候,也须要用一些简单的天然语言处理模型来把它先转换成计算机能够认识的语言。

回到决策树身上,其实决策树自己做为一个树形结构其实就是一堆if else

如今决策树也应用在了有监督机器学习模型上。

举个例子,好比quitting time是下班时间,你要作一个决策,今天到底晚上要不要学习?假以下班时间早于6点半,你会看今天要不要和女友去约个会;若是今天没有约会,回家也没有什么事情作,有可能就学习(Y)了;若是今每天气好,出去玩,确定就会致使不学习(N);假如9点半以后才下班,回家已经很是累了,你看跳槽的面试时间(deadline)还有两天以上,今天就休息,不学习了(N);或者面试已通过去两天了,心情已经平复下来,暂时也不学习(N)了;明天就要面试了,就可能学习(Y)。

这就是一个简单的决策树的形式,上面的图就是一棵树,咱们称这棵树quitting time这个节点叫作根节点,下面真正要去作决策的节点叫作叶子节点

如今这棵已经作好给你了,怎么作预测?来一条数据第一个维度记录着今天这我的下班的时间,第二个维度是有没有约会,第三个维度是deadline截止日期还有多少?有了这三个数据,只要扔到这个树里边,它在每个叶子结点要分裂的时候去读取相应的数据判断一下到底分到哪枝了,而后再读取数据来判断一下最后的结果。

树在生长的过程当中可不可能出现两个一样维度?好比have  a date分裂条件是true的状况下会接着再出现quitting time吗?在这个例子里面貌似是不会出现的,在实际的例子中这样是没问题的,只不过赋予它的意义有点矛盾了,但对某些数据的具体实际含义来讲,也有可能出现屡次的。

相关文章
相关标签/搜索