一场革命正在进行,可从条纹的变化里管中窥豹。算法
今年,来自伯克利的研究人员发布了两个视频。第一个视频里是一匹马在围栏里小跑;而在第二个视频中,这匹小跑中的马却渐渐变成了斑马。固然,这只是围栏的条纹刚好投射在马的身上而让它看起来像是斑马同样,并不是是说这匹马真的变成了斑马。安全
把马变成斑马不止是个漂亮的噱头,仍是机器学习算法重构现实的一个标志。例如,人们能够用图片编辑软件把图片里的黑熊变成熊猫,苹果变成橘子,猫变成狗加拿大新创公司琴鸟(Lyrebird)的机器学习专家能够从一分钟的人声样本中合成出可信的音频片断。Adobe公司推出的Sensei人工智能平台,把机器学习融入到视频、照片和音频编辑工具中去。这些项目有一个共同点:它们所制做出的场景和声音都很是真实。网络
这种技术将把咱们推向新的创造领域,不止能扩大艺术家的创造力,还能使业余爱好者具有专业人员的知识水平。咱们将从新定义创造力,把机器的产物也归入进来。可是有利有弊,别有用心者会利用这种技术制造假新闻。到时候,人们会担忧各类图像、文本、音频等内容是否被篡改过。此外还有一个问题,人类在专辑制做或者电视剧制做里扮演了什么角色?机器学习
一个充斥了人工智能产物的世界,能够很好,也能够很坏,与咱们近在咫尺。工具
目前,有两种方法来制做拟真的音频或视频。一是利用摄像头和麦克风实时拍摄,好比对登录月球的记录。二是利用人力复刻,这常常须要很高的代价。好比,若是登录月球是个骗局的话,那么,电影制做团队将必须筹备阿姆斯特朗迈去月球的“第一步”。如今,机器学习算法提供了第三种选择,它可让任何有基础的人,利用算法混合素材制造出无限可能的“真实”。学习
起初,深度学习生成的内容并不适合照相现实主义。2015年Google发布的“深度梦想(Deep Dreams)”利用了深度学习来造成怪诞的画做。2016年,一款名为“Prisma”的照片编辑程序经过深度学习为艺术照片添加滤镜,例如,它能使普通快照具备蒙德里安风格。这种技术就是风格转换,即采起某一图像的风格(如蒙克的《尖叫》),并将之应用于其余图像上使其具有相应风格的技术手段。动画
如今,样式转换的算法在逐渐完善,图像处理也更为精细,却也标志着“恐怖谷”的终结。这里说的“恐怖谷”是一种心理现象,指人们会对一个较高水平拟真的机器人感到恐惧,但若是这种拟真程度再次提升,人们的好感却会大幅度回升。现在,已经出现了跨越“恐怖谷”的算法了。康奈尔大学的卡维塔·巴拉(Kavita Bala)实验室正在进行相关研究,其深度学习能够将一张照片的风格(如一个闪烁的星空)注入到其余的大都市的快照中,且能以假乱真。此外,卡维塔·巴拉还在此基础上结合了人工智能创立了Grokstyle公司。若是你看中了朋友家沙发上的抱枕或者杂志上的某个东西,能够拍下来上传到Grokstyle公司的网站上,这家公司的算法就能够识别出图像中的家居物品,并列举出物品价格以及类似物品等。网站
卡维塔·巴拉说:“我喜欢这些技术,由于设计和时尚能就此变得大众起来。我是一名技术专家,我虽然喜欢美丽与时尚,却不能本身创造出来。但如今有了这种技术,不止我能玩美,人人均可以。”人工智能
十几年来,机器学习已经成为Adobe公司创意产品的一部分,但直到最近由于AI的兴起,才有了变革性的进展。在十月份,Sensei的工程师展现了一套名为“Adobe Cloak”的视频编辑工具,该工具让人们能够轻松实现无缝剪辑,无缝剪辑对专业的剪辑师来说也是极为复杂的工做。Adobe还推出了一个名为“Project Puppetron”的画风迁移软件,它可将所需的艺术风格事实应用到视频中。例如,一我的若是通过这个软件处理,可让本身在视频中显示成一个雕像或者是个漫画风格的人物。高级首席科学家乔恩·勃兰特(Jon Brandt)说:“人们能够在任何摄像头前进行演出,并将其实时转换成动画。”设计
相比以往的计算机视觉方法而言,机器学习更好地识别脸部的细微差别,使这些项目成为可能。Sensei让艺术家能更好地利用概念进行创造,不用在处理原材料上浪费时间。“Photoshop在处理像素方面很是出色,可是人们要的是像素组合以后所表明的内容。”勃兰特解释说,“这是好事。由于艺术家们没必要再浪费时间在小事上,他们的生产力一定就会提升。我预计即将会出现新的艺术形式并为此感到高兴。”
芝加哥大学学生姚元顺(音译)参与了一个探讨机器学习技术潜在风险的项目。他对一个由AI生成的奥巴马演讲视频进行了剪辑并开始思考:他能用文字作相似的事吗?
一个文本须要编得近乎完美才能欺骗到大多数读者,所以,他开始只制定一个小目标——去伪造点评网站Yelp或亚马逊平台的在线评论。这些评论只需几句话,也不需高水平的写做能力。因此姚元顺及其同事设计出了一个计算机神经网络,能够自动生成Yelp风格的点评。好比说,“咱们最喜欢的地方”,“我和个人兄弟一块儿去了,吃了素食面,很好吃”。以后让人们猜想这些评论是真实的仍是捏造的。人们很难辨别出来。雇佣水军进行虚假评价大约要花费10-50美圆。姚元顺认为,只要工程师想,就能让虚假评论自动化。此外,他还探讨了如何使用神经网络来防护虚假评论的进展。“据咱们所知,目前尚未出现这样的系统。”姚元顺说,“但也许在几年以后,咱们就将被AI生成的信息所包围。”
他的下一个目标是什么?生成使人信服的新闻报道。
视频传播得可能会更快。检测假照片和视频的专家尼·法立德(Hany Farid)担忧病毒内容传播速度太快,而验证过程又过慢。法里德认为,也许不久以后会出现伪造的特朗普总统视频并引起恐慌。“我尽可能不作极端预测,但我认为这很容易发生。”他说,“今天就可能发生。”
语音合成初创公司琴鸟(Lyrebird)伪造的特朗普的演讲视频在互联网上传播开了,尽管在公司发布的音频片断中,特朗普的手指是离开核弹按钮的,演讲的内容也只是赞美琴鸟公司。公司联合创始人兼首席执行官约瑟·索特罗(Jose Sotelo)认为,技术发展是必然的,但须要道德准则的约束。他认为,如今最好的防护就是提升对机器学习能力的认识。“若是看到我在月球上的照片,你可能会立刻意识到这是伪造的。”约瑟·索特罗说,“可是,若是你听到一段你好友的说你坏话的声音,你就很难鉴别真伪了。这是一项新技术,也是一个很是具备挑战性的问题。”
AI生成信息的浪潮势不可挡。最坏的状况是,骗子和政治人员会部署机器学习算法来产生大量伪造信息。再加上社交网络会有选择地传播最抓人眼球的内容,这样,那些伪造信息便会广为传播。
但看向好的一面,人工智能生成的内容也可能会极大地填补咱们的社交结构,抚慰人们的心灵。琴鸟公司的索特罗指望其公司的技术可使那些因病失声的人们从新开口。不止如此,AI在训练无人驾驶汽车方面也颇有一套。一般状况下,驾驶软件先是在虚拟环境中进行训练的,但像“侠盗猎车手”这样的世界也只是大体相似于现实。人们利用AI算法无限缩小虚拟环境与真实世界之间的差异,最终使无人驾驶汽车更安全。
这是AI的正反两面。随着AI的不断改进,它也会愈来愈趋近于人类,并最终会彻底具有人类特质——善恶共存。