计算机在识别图像时“看到”了什么?

图像识别技术近来进步飞速。去年,微软和谷歌展现了能比人类更准确地识别图像的系统。程序员

这些进步得益于一个叫作深度学习的技术,它涉及将数据经过模拟神经元的网络,以培养该网络在将来过滤数据(更多信息见“Teaching Machines to Understand Us”)。深度学习就是你可使用关键字搜索存储在谷歌的照片(更多信息),Facebook 能识别你照片中你朋友的缘由。 在图像识别上使用深度学习也使得机器人和自动驾驶汽车更有可行性,它甚至能够完全改变医学(更多信息)。网络

图片描述

图像识别技术的能力和灵活性来自于, 当人工神经网络收到不少图像和图像类别的信息时,它能够自动计算出来重要的视觉特征。在深度学习中使用的神经网络被布置成不一样的层,数据一层一层根据顺序经过。在训练过程当中,在神经网络中的不一样的层成为专门识别不一样类型的视觉特征的网络层。图像识别中使用的神经网络类型,被称为卷积网,受到了动物的视觉皮层方面研究的启发。学习

“这些神经网络相比传统的计算机视觉方法,是一个巨大的飞跃,由于它们直接从数据中得出结果。”马修·蔡勒,Clarifai(Clarifai 提供了包括 buzzfeed 在内的公司组织和搜索照片和视频的服务) 的 CEO 说。程序员们曾经须要写出寻找视觉特征所需的数学程序,然而这些程序并不能创造出不少有用的产品。google

当蔡勒仍是一个研究生的时候, 他在纽约大学与罗博·宏泰合做开发了一种可视化神经网络运做的方法。在这个连接中的幻灯片中的图像将带你来到这个深度学习网络的内部,这个用了130万张照片训练过,战胜了人类的图像识别神经网络。该网络识别了 1000 个大相径庭的物件,包括蚊账和蚊子,而幻灯片上显示了每一个图像中最强烈的激活神经元网络的一个网络层的视觉特征。spa

原文连接:https://www.technologyreview.com/s/60111...视频

相关文章
相关标签/搜索