计算机视觉

  Computer vision is the emulation of biological vision using computers and machines. It deals with the problem of inferring three-dimensional (3D) information about  the world and the objects in it from images or video data      ---- a problem that humans and many biological organisms have to solve almost every instant for their survival. ide

1 什么是计算机视觉 

  计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。人工智能

  视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各类智能/自主系统中不可分割的一部分。因为它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有普遍影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具备与人类水平至关的视觉能力。机器视觉须要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把全部这些处理都紧密地集成在一块儿。[Neg91]做为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。如今计算机视觉已成为一门不一样于人工智能、图象处理、模式识别等相关领域的成熟学科。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究很是有益。为此咱们将先介绍人类视觉。orm

1.2 计算机视觉 

  人类正在进入信息时代,计算机将愈来愈普遍地进入几乎全部领域。一方面是更多未经计算机专业训练的人也须要应用计算机,而另外一方面是计算机的功能愈来愈强,使用方法愈来愈复杂。这就令人在进行交谈和通信时的灵活性与目前在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可经过视觉和听觉,语言与外界交换信息,而且可用不一样的方式表示相同的含义,而目前的计算机却要求严格按照各类程序语言来编写程序,只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的状况。而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具备视觉、听觉和说话等能力。这时计算机必须具备逻辑推理和决策的能力。具备上述能力的计算机就是智能计算机。three

  智能计算机不但使计算机更便于为人们所使用,同时若是用这样的计算机来控制各类自动化装置特别是智能机器人,就可使这些自动化系统和智能机器人具备适应环境,和自主做出决策的能力。这就能够在各类场合取代人的繁重工做,或代替人到各类危险和恶劣环境中完成任务。开发

  计算机视觉就是用各类成象系统代替视觉器官做为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样经过视觉观察和理解世界,具备自主适应环境的能力。要通过长期的努力才能达到的目标。所以,在实现最终目标之前,人们努力的中期目标是创建一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成必定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,目前尚未条件实现象人那样能识别和理解任何环境,完成自主导航的系统。所以,目前人们努力的研究目标是实如今高速公路上具备道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的做用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉能够并且应该根据计算机系统的特色来进行视觉信息的处理。可是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在如下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。所以,用计算机信息处理的方法研究人类视觉的机理,创建人类视觉的计算理论,也是一个很是重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。文档

  有很多学科的研究目标与计算机视觉相近或与此有关。这些学科中包括图象处理、模式识别或图象识别、景物分析、图象理解等。因为历史发展或领域自己的特色这些学科互有差异,但又有某种程度的相互重迭。为了清晰起见,咱们把这些与计算机视觉有关的学科研究目标和方法的角度加以概括。数学

  1. 图象处理 

  图象处理技术把输入图象转换成具备所但愿特性的另外一幅图象。例如,可经过处理使输出图象有较高的信-噪比,或经过加强处理突出图象的细节,以便于操做员的检验。在计算机视觉研究中常常利用图象处理技术进行预处理和特征抽取。it

  2. 模式识别(图象识别

  模式识别技术根据从图象抽取的统计特性或结构信息,把图象分红予定的类别。例如,文字识别或指纹识别。在计算机视觉中模式识别技术常常用于对图象中的某些部分,例如分割区域的识别和分类。自动化

  3. 图象理解(景物分析)

  给定一幅图象,图象理解程序不只描述图象自己,并且描述和解释图象所表明的景物,以便对图象表明的内容做出决定。在人工智能视觉研究的初期常用景物分析这个术语,以强调二维图象与三维景物之间的区别。图象理解除了须要复杂的图象处理之外还须要具备关于景物成象的物理规律的知识以及与景物内容有关的知识。io

  在创建计算机视觉系统时须要用到上述学科中的有关技术,但计算机视觉研究的内容要比这些学科更为普遍。计算机视觉的研究与人类视觉的研究密切相关。为实现创建与人的视觉系统相相似的通用计算机视觉系统的目标须要创建人类视觉的计算机理论。

  (内容来自图像处理知识库)

相关文章
相关标签/搜索