这个软件真不简单

 

阅读本文大概须要 5 分钟。程序员

 


这两天想必你们应该被一个软件刷屏了,它的名字叫作 Zao,中文音译就叫“造”。它为何这么火呢?是由于咱们能够上传本身的一张照片,他就能把咱们的脸替换成一些热门视频的男主或女主的脸,也就是视频换脸。
安全

好比有人尝试了把尼古拉斯赵四的脸换到美国队长的脸上,美队的气质简直就是被垄断了,你们能够扫码看看:网络

图片美队变赵四架构

视频换脸技术你们应该早有耳闻,但这个软件有点意思,它抓住了几个点使得它一炮而红。ide

第一是这个软件的效果确实不错,我拿本身也作了实验,发现确实它渲染的一些结果几乎毫无违和感,毕竟这个软件核心拼的就是技术。工具

第二这个软件贴近于平常生活,咱们能够把本身的照片上传,让咱们真正成为视频里的主角。另外视频选材颇有讲究,都是一些剪辑过的明星精彩镜头,这样咱们生成的视频镜头会让咱们有变成明星的感受,很是有代入感。学习

技术实现

做为一名程序员,固然最关心的可能就是它的技术实现了,毋庸置疑它确定是利用了深度学习的一些技术。我看了一些文章和调研,大致了解了一下,下面稍微分析一下里面用到的一些技术。测试

总体而言呢,这个过程分为三步,他们分别是:编码

  • 人脸定位spa

  • 人脸转换

  • 人脸融合

人脸定位

如今深度学习对于人脸识别和定位的研究技术已经很是成熟和精准了,其核心就是使用了卷积神经网络,即 CNN,不一样的模型架构对于识别的准确率有不用的表现。

对于人脸的定位,通常是使用脸部的关键点定位的,这些点叫作 Landmarks。在一张人脸图像上,每张脸的轮廓和五官的位置都会被打上点,好比整个脸部的轮廓用一些点描出来,鼻子、眼睛、唇形一样用一些点描出来。

图片Facial Feature Detection

通常来讲一张脸会用 68 个点来标记出来,每识别的模型接收一张人脸图像,输出这 68 个点的坐标,这样咱们就能够实现人脸定位了。

如今现成的模型也不少了,好比 dlib,opencv 等开源工具包能够直接拿来使用了,若是要更精准地话可使用更复杂的卷积神经网络模型来实现,你们能够了解下相关论文。

人脸生成

有了标记点之后,这个软件就能够把咱们的人脸提取出来了,可是这有个问题,咱们上传的是一张静态图片,总不能直接生硬地替换进去吧,好比咱们上传的是一张正脸照片,那视频里的一些侧脸画面直接贴上那不就无法看了吗?

这时候就要用到另一个核心技术叫作人脸生成技术,有了它咱们就能够对人脸进行生成了,好比根据一张正脸图生成一张侧脸图。目前人脸生成技术主要有两种,有 GAN(生成对抗网络)和 VAE(变分自编码器),下面简单介绍一下它们的原理。

对于 GAN 来讲,它叫作生成对抗网络,为何叫对抗网络呢?是由于模型在训练的过程当中一直有两个东西在作对抗,这俩东西分别叫 Generator(生成器)和 Discriminator(判别器)。前者主要负责生成一张人脸,越像越牛逼。后者主要负责判断分辨前者生成的人脸是否是真的,断定越准越牛逼。两者在这个过程当中为了变得愈来愈牛逼,前者就会尽力去生成更像的人脸来欺骗后者,后者也会尽力去判别生成的人脸是否是真的来打击前者。这样两者在不断地训练和对抗过程当中,前者生成的结果就会愈来愈好了。

对于 VAE 呢,它是经过一些无监督学习的方式将人脸信息进行压缩,由编码器把它表示成一个短向量,这些向量里就包含了人脸的基本信息,好比肤色、唇形等信息,这样整个模型就能够学习到人脸的共性。而后,解码器将向量解码,将其转换为某一特定的人脸。这样就等于通过一层中间向量完成了从一张人脸到另外一张人脸的转换。

图像融合

最后的阶段就是图像融合了,也就是把生成的新的人脸和原来图像的背景融合,使之不会产生违和感。

在这个软件中,视频是由一帧一帧组成的,那么在转换的时候也须要一帧一帧处理,最后处理完成后再合成整个视频。

以上也就是我所了解到的变脸的一些方法。

安全性

有人说,这个技术不是什么好技术。万一有人拿着咱们的照片一变脸,就可以把咱们任意的表情和头部动做模拟出来,拿着去作认证,好比刷脸支付什么的咋办,那咱们的钱不就被盗刷了吗?

对于这个问题,支付宝官方也作了回应,支付宝称刷脸支付实际上会经过软硬件结合的方式进行检测,其会判断被刷物体是不是照片、视频或者软件模拟的方式生成的,能够有效避免身份冒用状况。其中有一个核心技术就是经过 3D 结构光摄像头来进行信息采集和识别,若是被拍摄物体是平面的,也就是说若是是照片或者视频,是没法经过检测的。

图片支付宝回应

这时候我天然而然想到,既然用的是 3D 结构光摄像头,那么若是用了 3D 打印技术把一我的的肖像打印出来,或者用一个很是逼真的蜡像来进行刷脸识别,能不能经过呢?我看了一些报道,发现很多案例的确经过了刷脸测试,好比解开了 iPhone 面部识别锁等等。但要经过 3D 打印技术来模拟一我的的肖像成本仍是蛮高的,因此基本上也不太会有人来搞这些。

若是对此还心有余悸的话,支付宝还回应称,即使是真的被盗刷了,支付宝也会经过保险公司进行全额赔付。

因此基本上是不用担忧其安全性的,尤为是 Zao 这个软件的出现是没有对刷脸支付的风险形成大的影响的,其就是增长了一个视频模拟的实现,对刷脸支付的安全性没有出现大的突破性威胁。

隐私性

这个就要好好说一下了,这个软件的出现同时引发了另外一个轩然大波,那就是其中的隐私条款。

其隐私条款有一条是这样的:

用户上传发布内容后,意味着赞成授予 ZAO 及其关联公司以及 ZAO 用户在“全球范围内彻底免费、不可撤销、永久、可转受权和可再许可的权利”,“包括但不限于能够对用户内容进行所有或部分的修改与编辑(如将短视频中的人脸或者声音换成另外一我的的人脸或者声音等)以及对修改先后的用户内容进行信息网络传播以及《著做权法》规定的由著做权人享有的所有著做财产权利及邻接权利”。

这条款没人说还真没注意到,由于通常咱用一个软件,通常不会去仔细看它的条款,那么密密麻麻的一坨,有几我的会去仔细看呢?但要不一样意,这个软件还无法用,因此用过这个软件的人,这个条款必定是已经赞成了。

这条条款实际上是很过度的,赞成授予 Zao 及其关联公司以及 Zao 用户在“全球范围内彻底免费、不可撤销、永久、可转受权和可再许可的权利。注意这里有几个词,彻底免费、不可撤销、永久、可转受权、可再许可,这几个词就表明咱们已经把咱们的肖像权永久授予了 Zao 及其关联公司了,并且不能撤销,帐号注销了也不能撤销,也就是之后它们能够有权利永久滥用咱们的肖像。更可怕的是,其中还有一个词叫可转受权,那也就是说,Zao 能够对咱们的肖像权进行转受权,你懂得,给点钱,啥办不到呢?这就更没法控制了,这可能就意味着,世界上任何一我的可能都能得到咱们的肖像权。

因此说,若是你还没用的话,必定要谨慎谨慎再谨慎!

哎,反正我已经赞成了,貌似我如今也没什么办法了。

社会影响

这个软件的出现,更深一点想,其实它所隐含的影响仍是蛮大的。

有了这个变脸技术,若是有人得到了咱们在条款里面所”捐出“的肖像权,拿着咱们的照片去生产那种你懂得的影片,把视频里面的男主或者女主换成咱们的人脸,而后处处传播,或者以此做为敲诈勒索的工具。即使咱们有理,那也说不清了,首先这个条款已经说了它们能够有权利随意使用咱们的肖像,因此告侵犯肖像权已经行不通了,并且即便咱们有证据证实这是假的,但这种视频的传播也必定会带来很是大的影响。

按照如今大众们的观念,好比说一张图,咱们若是不信的话能够说它是 P 的,但若是换作是视频的话,不少人可能就会相信了,由于不少人不知道视频中的肖像也能够伪造得这么真了,毕竟不少人并不知道这种技术。所以,有了这种技术的出现,之后视频类的证据,可能也不可信了。所以这个软件的出现,能够说从另外一个侧面昭示,之后视频也不能做为犯案的证据和验证人的真伪的依据了。

因此之后多是这样子的:

  • 坐在电脑面前的网络女主播,即使不开美颜和滤镜,你所看到的她也不是真的她了。

  • 你要给人打个钱,说开个视频吧,我看看是否是真的你,即使看到的是他,你也不能信了。

  • 有人要 Qiao Zha 你,把你的人脸换成 Zuo An 分子的脸,你到哪里说理去?

  • 某一天,你做为男女主角,出如今了 P 站和 91….

我一开始想的还没这么深,边想边写,写到这,我本身都开始后怕了…

怎么甚至感受,之后的社会可能会乱套了呢?这可能就是 AI 发展的一个隐患吧。

因此写到最后,虽然这个软件颇有意思,但仍是劝你们尚未用的就不要用了吧,真的很可怕。同时我也不知道这个软件这样的条款和作法会不会有什么问题,但仍是但愿能引发有关部门的注意。

之后,也但愿你们也能够在使用软件的时候,要更加谨慎和当心,有条款就稍微看一看,尤为是对于这种和用户隐私相关的软件,要更加心存戒备。

相关文章
相关标签/搜索