相信没有人是先上学而后才学会说话的,在咱们张口开始学习说话的时候,爸爸妈妈也不会给孩子们说什么主谓宾定状补这样的语法,而是一句一句的教咱们怎么说,那句对,那句错。在咱们学习语法以前,早已能够和别人流畅的交流了。机器学习
上世纪,蓝色巨人IBM公司决心利用计算机技术,开发一款翻译软件,因而将各类语言的字、词、语法都编进了程序,在随后的实际使用中发现,在联合国大会这种正式场合,翻译的准确率至关高,可是在其余平常场景下,彻底没法使用。道理很简单,国际大会这种场合,发言稿都是教科书式的标准,而平常语言,彻底毫无章法,不符合语法是正常状况。面对这种状况,IBM尝试了不少办法,最终都没法解决。ide
大数据又是如何来解决这个问题,举个例子,我要表达我饿了,我能够有不少种说法“我饿了”,“如今给我吃什么都香”,“我都前胸贴后背了”,大数据就是将这些话全都收集起来,统一归类到一个意思,“我饿了”,那么为了能覆盖各类可能的说法,就须要去收集大量,海量的关于“我饿了”这个意思的各类说法,当收集的量足够大时,任何人说的一句这个意思的话,均可以在这个库里找到对应或者类似度很高的话,那么就能够定义是“我饿了”。学习
如今超市里出现一种自动识别物品的承重称,你用袋子把水果装好,往称上一放,摄像头拍一下就知道你放的是什么水果,我想也是这个原理,程序里并无定义苹果应该是什么样子,多大,多圆,表皮什么颜色,等等,而是放上几百上千张各类苹果的照片,比对一下就知道了。大数据
从上面能够看出来,大数据、机器学习,会须要海量的存储空间和算力去处理数据。其实咱们人脑的学习过程,不也就是这样的吗,妈妈告诉你这是苹果,那个是苹果,你就记住了,这样的就是苹果。这么看起来,人脑还真是厉害,消耗那么一点点能量,却能完成须要那么多空间算力才能解决的事情。翻译