图像处理,计算机视觉和人工智能之间的差别git
https://medium.com/@pallawi.ds/difference-between-image-processing-computer-vision-and-artificial-intelligence-af670d65055dgithub
做者:Pallawi算法
图像处理和计算机视觉是超级兴奋的研究和研究领域。随着人工智能的进步,这两个领域都在不断发展。后端
为任何AI产品命名,你会发现计算机视觉在制造每一个智能系统中起着重要做用。我已经提供了一些使人惊讶的连接,能够在本博客的最后使用该应用程序,你能够本身尝试并体验这些颠覆性技术如何改变世界先后的工做方式。app
所以,在本博客中,我将帮助你了解图像处理,计算机视觉和人工智能之间的区别。机器学习
我提出了一个有趣的状况,这将有助于你很是轻松地理解全部这三个主题。函数
“因此,在假期你决定点击你的两只宠物狗的照片”Shimmy“和”Pluto“训练,在你美丽的花园里进行一场比赛。 “Shimmy”必须在拿球后走左路,“冥王星”应该走正确的路线。“学习
图像处理测试
你点击了数百张照片,很快就完成了拍摄照片,如今你但愿在社交媒体上上传完美的照片。 但在发布图像以前,你但愿图像看起来更周到,而且你还但愿告诉你的朋友,图像是在周日早上7点拍摄的,并在图像上打印出可爱的宠物名称做为主题标签。人工智能
要完成上述全部操做,你决定经过图像编辑移动应用程序传递图像,该应用程序在后端运行多个功能,并在每一个功能中运行图像处理算法,该算法将你的图像做为输入对图像执行数学运算,如在算法中并给出所需的输出图像。 以下图所示,你能够看到从新分布的色调级别(伽马校订),输出图像和嵌入其中的文本。
[1]: 左图像是输入图像,右图像是处理图像
这是个人图像处理代码的连接,它很容易和有趣的尝试本身。
https://github.com/PallawiSinghal/AIStarter/blob/master/imageprocessing.ipynb
计算机视觉
如今,你但愿奖励你的宠物“Shimmy”和“Pluto”做为获胜者和亚军,根据谁在他们的嘴里抓住红苹果或黄色圆盘的最大次数并将它们返回给你在他们各自的轨道上移动 ,左边是“Shimmy”,右边是“Pluto”(游戏规则)。
你能够经过查看上面的图像来轻松决定Shimmy是赢家,但若是你天天玩50次游戏并且每周玩7天,该怎么办?
而后经过查看图像决定谁是胜者,如今数量已增长到每周350张图像变成一项艰巨的任务。
因此,如今你必须创建一个计算机视觉系统来自动化你的工做。
所以,CV(计算机视觉)系统的第一步应该对350的每一个图像进行详细分析。
分析阶段
这项分析的目的是找到一个通用的解决方案,不只仅是几百个图像,而是多年来的许多图像。
咱们在图像中必须寻找的是大多数时候宠物如何出如今图像中的模式。就像这里“Shimmy”在左侧轨道,“Pluto”在右侧。
此外,深刻分析图像质量,如图像中局部和全局噪声的数量,对比度加强的要求和边缘保存。在图像中须要和容易分割。此外,哪些图像的特征是提取以找到带球的宠物,其能够是球的形状或狗的颜色。
如今计算机视觉主要是两个主要的事情,分析和图像处理算法,你选择联合起来得出这样的结论,谁是两个宠物中的胜利者。
图像处理算法在对大量数据进行详细分析后智能地进行分组,以给出正确的结果,例如每只宠物抓住球的次数,玩家公平,什么时候以及为何宠物未能接球,最大或最小高度若是给定任何输入图像定义计算机视觉系统,则捕获球。它是关于归纳或提供结合许多图像处理算法的可扩展解决方案。
因为图像处理辅助计算机视觉从图像中获取更有意义的信息,所以它还使开发人员的分析质量极其独立,负责开发通用解决方案,以便经过CV系统得到较不类似的测试图像的准确输出。
在下面的图像中,你能够看到我发现“Shimmy”有黄色磁盘。我经过执行图像分割,轮廓搜索,凸包检测,多边形逼近,将多边形映射到空白图像并最终使用模板匹配检测黄色磁盘来完成此操做。
[2]: 左图是输入图像,中间图像是掩模(若是你不断看图像一段时间你能够找到从中心到角的强度差别),右图是背景图像(这个背景) 使用很是著名的OpenCV函数“Grabcut”完成删除(前景和背景分割)。
[3]: 第一个图像是上面最右边图像的模糊图像,这里使用的模糊像处理算法,用于边缘保存和噪声消除。 第二幅图像是灰度图像。 第三图像是阈值图像,也称为二值图像。 第四个图像是第三个图像的轮廓图像(简单地说,咱们试图在全部颜色为白色的物体上绘制边界,其中也包括宠物),在最后一个图像中,咱们经过周长逼近最大轮廓使用凸包,这里最大的轮廓将是宠物的轮廓,并在图像上绘制近似的形状,多边形。
[4]: 左图像是该步骤的输入图像,咱们制做近似的小掩模(中心图像)以将宠物多边形转移(也称为翘曲,wrapping)到小图像(中心图像)上。 翘曲后的结果看起来像右图
[5]: 左图是这里的输入,咱们使用黄色光盘的小模板图像在此图像上进行模板匹配,以下图所示。 模板匹配是一种算法,模板图像从输入图像的顶部到底部移动,输入图像是咱们状况下最左边的图像,并在输入图像中找到最佳匹配部分。 模板匹配的输出将是中心图像,由于你能够看到图像中最亮和闪亮的部分是黄色光盘所在的位置。 所以,咱们在最右边的图像上绘制一个框。
[6]: 模板图片
我很是确定,若是你是初学者,你必须查找一下上面充满那些没有听过的词。 但请相信我,这是一个从分析到算法设计的很是有趣和创造性的旅程。
这是个人GitHub账户的连接,你能够在其中找到计算机视觉系统的代码,该系统能够找到谁有球。 我将在即将发布的博客中撰写关于全部部分的详细博客,并提供连接。 但若是您如今有任何疑问,请随时在评论部分询问我。
Here is the link to my code for Computer Vision, it is easy and intresting to try on your own.
https://github.com/PallawiSinghal/AIStarter/blob/master/computervision.ipynb
人工智能
若是你选择硬阈值来检测“Shimmy”,“Pluto”或黄色循环,例如应用半自动分割(OpenCV grab cut),模板匹配,决定宠物应移动的轨道,则此设计的系统可能缺少可扩展性或宠物身体的颜色阈值。你最终可能会建立一个只能识别“Shimmy”和“Pluto”的偏见系统。
你将没法将你的CV系统交给世界,以便在不一样的狗或猫身上获得相同的结果,由于规则和特征只偏向于“Shimmy”和“Pluto”。
人工智能“救世主”提供图像处理,计算机视觉算法和机器学习算法,以帮助你像魔术同样推广系统。
它是一个像咱们的大脑这样的系统,它经过不断地查看周围的事物来智能,合理和准确地采起它所学习的任何决策,这只不过是数据,而且经过随时间学习的反馈和经验来更新所得到的知识。
就像你在教育系统中长大的学习同样,你的老师教你用图像来区分世俗的东西,给你的大脑喂两个输入,一个是图像,第二个是正确的特征描述,它的外观和位置在图片。
一样,若是咱们想为上述类比构建一个AI系统,咱们须要使用图像处理算法提供预处理的图像,并告诉他们你想要检测的球,磁盘,苹果,狗或任何东西的位置并存在于图像中。
而后,一旦图像和图像的内容,信息被提供给系统,计算机视觉就会出如今图片中。
AI由多层组成,就像一包面包同样,每层运行一个计算机视觉算法,其工做是从图像中提取特征。
在前几层中,咱们提取图像上的直线或曲线边缘等低级特征,而后在它学习检测眼睛,苹果,爪子,尾巴以及后来完成的每层中提取全部提取的特征。狗或猫。稍后您将使用这些学习过滤器来预测新数据集上的对象,该数据集也称为测试数据集。
[7]: 以上图片由https://www.cc.gatech.edu/~hays/compvision/proj6/提供,能够在此处查看图层的外观以及每层的特征提取方式。
固然有数学方程式。 可是,让我向你保证,他们很容易,你能够作到。
而且全部的学习都保存在模型中,就像咱们的学习保存在咱们的大脑中同样,它是通用的,能够用于任何其余数据。
构建AI解决方案的一个很是关键的输入是数据。 想象一下,你须要付出的努力才能创造出一个狗在世界各地玩球的数据集(没有差错的数据集)。
所以,总结三个方面的图像处理,计算机视觉和机器学习造成了一我的工智能系统,你能够在其周围听到,看到和体验。
总结
我试图解决一个很是简单但很是重要的话题,这个领域的每一个初学者都想要理解。 当我开始学习这个领域时,我老是有这个问题,并且我发现不多有人明确地回答个人问题。 我但愿我能帮到你。 我强烈建议你为每一个部分运行个人代码。 它很是简单,有助于在你对这些普遍主题的想法中创建清晰度。