唐旭 发自 RUC
量子位 报道 | 公众号 QbitAIhtml
从计算机视觉到天然语言处理,在过去的几年里,深度学习技术被应用到了数以百计的实际问题中。诸多案例也已经证实,深度学习能让工做比以前作得更好。react
今天,量子位为你们收集了20个深度学习方面的优秀应用——固然,这份榜单可能并不详尽,但相信看过以后,你对这项技术在某些领域的潜力会有更清晰的认识。git
针对每一个应用,咱们还尽可能收集了相关的Demo、Paper和Code等信息。github
斯坦福大学的一个小组作了一款名为Face2Face的应用,这套系统可以利用人脸捕捉,让你在视频里实时扮演另外一我的,简单来说,就是能够把你的面部表情实时移植到视频里正在发表演讲的美国总统身上。算法
一样的原理也能够用于对视频里场景的3D重建、电影特效也能够这么干。安全
这个应用的实际效果是这样的:微信
Paper:网络
http://www.graphics.stanford.edu/~niessner/papers/2016/1facetoface/thies2016face.pdfapp
左图是拍摄于1937年的一幅矿工的照片,右图是用Let there be color!从新自动上色后的效果。ide
上图是拍摄于1909年的一张保龄球馆的照片,下图是用Let there be color!从新上色后的效果。
实际上,这是运用深度学习网络学习天然存在于照片中的某些模式——好比,天一般是蓝的,云是白的或者灰的,草是绿的。经过这类规则,Let there be color!不须要人类的介入就能对照片进行从新上色。虽然有时它也会犯错,但这种错误很难被发现。
一样地,Let there be color!也能够把黑白视频变成彩色的。
Demo:
Automatic Image Colorization・白黒画像の自動色付け
Paper:
http://hi.cs.waseda.ac.jp/~iizuka/projects/colorization/data/colorization_sig2016.pdf
Code:
satoshiiizuka/siggraph2016_colorization
我为何不看美剧CSI?缘由很简单:太假了。里面的主角动不动就把一段视频拉近、放大——而后他们就获得了一幅分辨率远超真实状况的影像。这根本不现实……
直到深度学习出现。今年早些时候,谷歌大脑的研究者们训练了一个深度学习网络,他们让后者根据一些分辨率极低的人脸图像来预测这些面孔真实的样子。以下图:
最左边是输入的8×8像素的原始影像,最右一列是被拍摄的人脸在照片中的真实效果,中间则是电脑的猜想。
能够看到,虽然并不完美,但电脑预估出的结果已经与实际状况十分接近。Google的研究者将这种方法命名为 Pixel Recursive Super Resolution(像素递归超分辨率),用这种方法能显著提高图像的质量。
Paper:
[1702.00783] Pixel Recursive Super Resolution
深度学习网络已经能在预估动做方面帮动画师很大的忙,现在,咱们甚至能作到实时预估。康奈尔大学Zhe Cao等人教会了一个神经网络估算人类骨架位置的变化。
在以下的gif中,你能够看到一群人在街头跳舞,而经过这种神经网络,咱们能知道他们在哪、如何作动做。
Paper:
https://arxiv.org/abs/1611.08050
用电脑来对照片进行自动分类已经很常见了。好比,Facebook能在分享的照片里标记出你的好友,Google能够为你的照片打上标签以便更有效率地进行搜索。
而现在,深度学习已经能够对照片中的各类元素进行描述。在Andrej Karpathy和李飞飞所作的一项工做中,他们训练了一个能对照片中不一样区域内元素进行识别,并用一句话来描述照片的深度学习系统。
Demo:
Paper:
这个应用有点恶搞的意思。如今,无论你手里拿到了谁的照片,用Ganin等人开发的这个深度学习网络过一下,你就可让他的眼睛动起来:你可让他上下看、左右看,甚至绕着圈看……好吧,除了生产表情包,其实也不知道它还能干什么用……
这是一些例子,里面有伊丽莎白女王、奥巴马、莎拉波娃……等等:
Demo:
Paper:
http://sites.skoltech.ru/compvision/projects/deepwarp/files/deepwarp_eccv2016.pdf
来自怀俄明州立大学的Anh Nguyen以及其余几位研究者开发了一套能用迭代的方式从已有照片中合成全新照片的深度学习网络。如下是一些电脑合成的样片,结果使人惊艳:
Paper:
https://arxiv.org/pdf/1612.00005.pdf
众所周知,卷积神经网络在图像识别分类领域有着很是好的前景。利用深度学习,咱们能够将抓拍到的珍稀动物(好比鲸鱼)照片进行分类,从而更好地估算某种动物的存活数量。
其余的例子包括浮游生物、植物等等。
分类浮游生物的介绍:
Classifying plankton with deep neural networks
Code:
这个点子与以前提到的Let there be color!有点相似,不过要更有创造力一点。你能够往电脑中输入一幅简笔画,甚至一些色块,而后让电脑发挥本身的创造力输出新的图片。相似地,你也能够把衣服航拍照片变成一幅地图,将白天的场景变成夜晚。
前段时间特别火的信手画猫(传送门:人工智能拯救渣画手,我分分钟画只猫给你看),也是基于这个技术。
Paper:
https://arxiv.org/pdf/1611.07004v1.pdf
Code:
牛津视觉几何小组运用深度学习技术开发了一项应用,它能够读出视频中的文字,输入文字,就能够直接搜出图像中包含这些文字的BBC新闻视频。好比,这是对“London”的一部分搜索结果:
Demo:
Visual Geometry Group Home Page
Paper:
[1412.1842] Reading Text in the Wild with Convolutional Neural Networks
Google Sunroof首先会根据Google地球的航拍地图为你家的屋顶建立一个3D模型,而后再用深度学习将屋顶和周围的数目区分开,接着根据太阳运行轨迹以及天气情况,就能够估算出安装了太阳能电池板的房顶能收集到多少太阳能。
项目首页:
https://www.google.com/get/sunroof#p=0
Google的Deepmind团队用深度强化技术教会了AI玩《打砖块》(Breakout,基本你们都玩过,具体是什么请看下图)。
测试过程当中,电脑并无依据任何游戏规则被进行特殊的编成,他们只是将键盘的控制权交给AI,而后对它进行不断地训练。起初,AI玩得十分糟糕;但通过两个小时的训练以后,画风就变成了这个样子的:
Paper:
https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf
Code:
https://sites.google.com/a/deepmind.com/dqn/
打砖块还不够?深度学习技术还被用来在更多游戏领域训练AI,包括:《小蜜蜂》、《毁灭公爵》、《乒乓》等几十种游戏。在大多数的游戏里,深度学习网络已经玩的比有经验的玩家更好,一样全部的玩法都是AI本身摸索的。
Paper:
http://www.davidqiu.com:8888/research/nature14236.pdf
来自牛津大学和Deepmind的科学家共同完成了这一项目。LipNet在读唇的准确率方面达到了惊人93%,远超人类读唇者52%的平均水平。
Paper:
https://arxiv.org/pdf/1611.01599.pdf
Code:
现在,运用深度学习技术,可让AI对某一幅画的风格、色彩、明暗等元素进行学习,而后将这幅画上的风格移植到另外一幅上,并且效果很是不错。
这么说可能不够直观,来看几个例子:
下面从左到右,依次是毕加索、梵·高和莫奈风格的蒙娜丽莎。
而这是某位老哥用AI创做的谷歌地图风格的蒙娜丽莎……
Demo:
Paper:
如今电脑不光能用来打字,还能用来写字了:多伦多大学的Alex Graves教会了电脑用多种不一样的风格来书写。
Demo:
http://www.cs.toronto.edu/~graves/handwriting.html
Paper:
[1308.0850] Generating Sequences With Recurrent Neural Networks
Gebru等人收集了5000万张Google街景照片,而后用深度学习技术加以挖掘看看能发现什么。结果,深度学习不只识别出了2200万辆汽车的材质、车型、年份等,还从中发现了一些关联,好比能够经过对车型的识别来分析某片区域的人口情况。
更有趣的是,AI发现,若是在一段15分钟长的驾驶路程上遇到的轿车比皮卡更多,那么这个城市在下届的总统选举中有88%的概率将选票投给民主党;不然,则有82%的概率投给共和党。
Paper:
https://arxiv.org/pdf/1702.06683.pdf
2015年,Google的研究者找到了一种用深度学习来加强图像特征的方法,随后,他们就开发了Deep Dreaming——它可以在图片中生成一些难以想象的幻象。由于有些和梦境十分类似,所以取名Deep Dreaming。具体生成什么样的幻想与这个深度学习系统最近被暴露在什么样的环境下有关,有时它甚至能生成吓人的噩梦。
项目首页:
https://research.googleblog.com/2015/06/inceptionism-going-deeper-into-neural.html
影集:
Google Deep Dream: 19 of the best images from mesmerising photo software
Code:
Google大脑的研究团队建立了两个深度学习网络用于安全工具开发,他们让其中一个不断创造本身的加密算法,而后让另外一个网络去尽力攻破它。在两套系统的反复缠斗后,第一个系统已经能生成很是优秀的安全加密算法。
然而,第二套算法也老是表现得比它更好……
Paper:
https://arxiv.org/pdf/1610.06918v1.pdf
哈佛的科学家们运用深度学习技术让电脑学会“粘弹性计算”——一种被用于预测地震的计算方法。结果,计算的效果在AI上大大被加强了。
然而,计算机同时将计算速度提升了50000%。在地震中,时间就是生命。所以,目前用AI来预测地震还为时尚早。
Paper:
https://arxiv.org/pdf/1701.08884v1.pdf
好啦,先介绍到这里。若是漏掉了“好厉害!”的深度学习应用,欢迎留言补充~
咱们的公众号也叫量子位(QbitAI),关注并回复“今天”,看更多AI领域大新闻。
另外,欢迎加量子位小助手的微信:qbitbot,若是你研究或者从事AI领域,小助手会把你带入量子位的交流群里。