视觉注意力机制

引言:如何在浩海如烟的数字图像数据中快速、高效、准确地找到人们所须要的图像信息,已变 成一个亟待解决的问题。人类对数据具备异常突出的筛选能力,能迅速觉察到与自身相关的重要信息,把目光集中到本身感兴趣的方面。根据人类视觉原理,“注意” 是人类信息加工过程当中的一项重要的心理调节机制,它可以对有限的信息加工资源进行分配,使感知具有选择能力。这种具备选择性和主动性的心理活动被称为视觉注意机制。视觉注意机制的显著区域检测在图像分析过程当中有着很是重要的意义,愈来愈多的研究者将这种注意机制引入图像分析领域,以得到高效、准确的图像检索能力。微信


1 视觉注意力机制
学习


1.1 视觉注意力问题描述人工智能


视觉注意是属于神经生物学范畴的概念,它是在生物视觉信息处理过程当中是一个很是重要的过程。当视网膜拥有整个场景时,注意力一次只集中在一个或者为数不多的几个区域上。spa



关于视觉系统中注意力机制一直是认知科学领域的一个重要研究课题,受到神经科学、认知心理学以及相关学科的众多研究者的关注。人眼在观察周围视觉信息的时候, 观察者即便被给定了较长的浏览时间, 仍将会把注意力汇集在一些特定的区域上。注意程度高的区域在人眼视网膜上的黄斑上成像,该区域的信息被选择进入高层知觉过程;而散布在视网膜其余区域的杆状细胞只能在弱光下检测亮度信息,没有色彩的感受,分辨率较低,仅能分辨出视野景物中的通常轮廓。因此,图像成像在黄斑以外的其余区域, 仅仅能够得到一个大概的影像信息。视觉生物神经方面的研究成果为注意力机制提供了生物学基础。

.net

大多数视觉心理学研究结论将早期视觉过程划分为两阶段:前注意阶段和注意阶段。视觉显
著性是指在视觉前注意阶段中, 可以迅速引发观察者注意的程度。显著性高的客体容易被 观察者选择性接受。视觉注意力计算模型旨在模拟人的视觉感知过程,根据视觉对图像中客体的注意程度计算显著程度,即对视觉信息进行显著性分析的过程。

设计

1. 2 自底向上和自顶向下视觉注意力模型blog


根据注意过程的引导方式, 可将现有注意机制计算模型分为自底向上模型和自顶向下的模型。资源


自底向上的注意机制模型是指由外界信号的特性而决定注意的导向。自底向上的注意模型没有特定的目标约束,是人们在浏览外界视觉信息时,对具备显著特征的客体进行选择的过程,这个过程彻底由外部视觉刺激触发、不受意识支配的,沿着自下向上的方向被处理的,其特色主要有两点:
get


1) 数据驱动。自底向上的选择性注意机制是由做为底层数据的视觉刺激驱动的,与做为高层知识的观察任务无关,咱们没法有意识地控制其信息处理过程。
io


2) 自动加工。自底向上的选择性注意机制是一种自动加工过程。它对视觉信息的处理速度很快,并且是以空间并行方式在多个通道中同时处理视觉信息的。


自顶向下的模型是选择性注意力机制的另一种类型。给定某个观察任务, 人类视觉在自顶向下的选择性注意机制的帮助下, 可以迅速创建视觉指望, 并在该指望的指导下按照必定的优先级顺序有选择地对各个场景区域进行局部验证, 进而对其中通过证明含有指望目标的场景区域进行局部处理。一般状况下,那些包含指望目标的场景区域都会因为其符合视觉指望的视觉刺激分布模式而具备较高的优先级。显然将这种由观察任务驱动的自顶向下的选择性注意机制引入图像信息处理过程是很是必要的。


2 视觉注意力模型分析


对视觉选择性注意机制, 目前多数研究的是如何创建隐式注意的自底向上的计算模型,是由于显式注意更加复杂,涉及更多目前还未知的东西,隐式注意相对来讲有更多的实验数据和认知模型能够参考。引导注意的自底向上因素主要来自于视觉任务, 而视觉任务是变幻无穷的,一般表现为知识,但对知识,目前尚未很好的描述模型,而是具体问题具体对待。因此,人们更多地研究自底向上方面。通常而言,设计任何一个视觉注意的计算模型, 首先都要涉及如下 5 个方面。

1) 肯定模 型 是 针 对 隐 式 注 意 还 是 显 式 注 意。不一样的注意方式所引发处理过程是不同的,注意方式对处理过程起着决定性做用。

2) 肯定模型中注意是否引入视觉物体识别。在生物视觉系统中, 注意所在的“Where” 通道和识别所在的“What” 通道之间有复杂的相互关系,注意和识别是密不可分的。目前这二者 交互的机理还远远不为人们所了解。


3) 预注意阶段。预注意阶段主要进行一些早期视觉特征计算,那么到底哪些特征自下而上地引导注意呢? 研究代表,既能够是一些基本的特征,如颜 色、运动、方向以及尺度,也 能够是特征的组合,如2D图像或3D场景中的物体,甚至还能够是学习获得的特征 ,不一样的特征对注意引导的做用依赖于它们在图像中的对比度。


4) 显著图生成。在预注意阶段,一些视觉特征被计算出来, 将利用这些计算结果来引导视觉注意。现有的模型几乎都是使用了基于显著图的方式。现有模型之间的不一样之处正是在于如何由一些早期视觉特征来融合获得显著图, 这是一个模型的核心和关键之处


5) 视觉转移的控制策略在获得显著图后,视觉如何转移呢? 经过认知实验可知,它取决于两点:一是对当前注视点的识别结果;二是一旦某个物体被注视过了,那么它的显著性会被抑制


从以上 可 知,注意计算模型一般包括两大模块:早期视觉特征提取与显著图生成模块和注视区域 / 物体选取与转移模块显著图的生成是计算模型的核心。








本文分享自微信公众号 - AI MOOC人工智能平台(AIMOOC_XLAB)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。

相关文章
相关标签/搜索