Google给AI出了UX设计指南

本文由 「AI前线」原创,原文连接: Google给AI出了UX设计指南
策划编辑|Natalie
做者|Josh Lovejoy
编译|Debra,薛命灯

AI 前线导读:”AI 的做用不该该只是大海捞针,而是帮助咱们拨开云雾,让咱们本身去发现明月。经过 Google 的 AI 产品 Google Clips,让咱们来看看以人为本的设计是如何让 AI 上升到另外一个高度的。”面试


就像移动革命以及以前的互联网同样,机器学习让咱们从新思考、构思并考虑咱们过去所得到经验还有多少可能性。在 Google UX 社区中,咱们开启了一项名为“以人为中心的机器学习”项目,以引导关于这个话题的讨论和关注。透过镜头,咱们来看看机器学习(ML)产品如何用独特的方式解决人类的需求。这个项目是 Google 团队的成果,旨在让 UXers 们了解核心 ML 的概念,以及如何用最佳的方式将 ML 整合到 UX 工具带中,并确保以包容的方式构建 ML 和 AI。算法

Google Clips 相机捕捉的父母、孩子和宠物的真实场景架构

Google Clips 是一款智能相机,设计的初衷是用来捕捉用户熟悉的人和宠物最真实的时刻。这款相机可以彻底凭借设备上的机器智能,专一于学习和你在一块儿度过期光的人或宠物,并可以理解怎样拍出漂亮和使人难忘的照片。以 Google Clips 做为案例,咱们将回顾三年来这款产品从在设备上建模、工业设计到用户界面创建过程当中的核心要点, 以及在 AI 驱动产品实践中以人为本的设计理念。框架


使用 Google Clips 能够选择完美的框架(上图左侧),并保存为一张静止图像(上图右侧)。在这个例子中,我把相机夹在篮筐上,捕捉我儿子投篮的瞬间机器学习

若是不符合人的需求,即便系统功能再强大,也仅能解决小问题,或者根本解决不了问题。工具

仅仅让更多的 UXers 使用 ML 产品是不够的。让他们了解某些核心 ML 的概念,理解 AI 及其功能的理念,以最好的性能来构建和维护用户的信任是相当重要的。性能

从肯定哪些模型对构建有用,到数据收集、注释、新型原型和测试,ML 生命周期中的每个阶段都是创新的时机。学习

如下是为何咱们认为采用以人为本的理念来构建由 ML 驱动的产品和系统很是重要:测试

  • 机器学习不会找出须要解决的问题。若是不符合人的需求,即便系统功能再强大,也仅能解决小问题,或者根本解决不了问题。
  • 若是 AI 系统的目标不透明,用户对校准系统的做用认识不清,那么他们对 AI 会造成一种固化印象,影响他们的信任感。
  • 为了发展,机器学习必须是跨学科的。即使不是这么绝对,但做为社会系统挑战的同时也能够被视为一项技术挑战。机器学习是一门根据在数据中自动发现的模式和关系进行预测的科学。 ML 模型的工做就是要弄清楚这些模式的重要性,以达到最大的准确性。可是,它的任务不只这一个。ML 的每个方面都是由人的判断推进和调解的,首先从创建模型的思路,选择训练的数据源,样本数据自己以及用于描述它的方法和标签,到上述定义错误和正确性的标准。一言以蔽之,UX 界的公理“你不是用户”在这里比以往任什么时候候都更重要。


三种以人为中心的设计理念让 AI 更上一层楼大数据

解决人类真正的需求今年,人们将拍摄大约一万亿张照片,这对咱们大多数人来讲,它们只是一个不会再去翻阅的照片库而已。新生儿父母尤为如此,他们的生活充满了人生中的第一次。在那些值得记念的珍贵时刻,用户会选择拿出他们的手机捕捉下这些美好的瞬间。结果,这样致使他们每每只能经过一方小小的屏幕来观看这个世界,而不是用他们全部的感官进行互动。

做为一个新的父母,你的图库可能看起来和个人同样,为了抓拍到完美可爱的表情而进行连续拍摄。

若是咱们可以设计一款产品,可以帮助咱们记录下咱们关心的人的每一个瞬间呢?如何咱们能够出如今照片中,而不是老是在照相机以后呢?若是咱们可以及时拍摄下照片,而没必要因必须停下来,拿出电话,打开相机,打开镜头而破坏了兴致?并且,若是咱们可以让摄影师在咱们身边捕捉到更多真实的生活时刻,好比个人孩子真实的微笑,应该怎么办?这就是咱们要解决的问题。

为信息作引导

当咱们开始这项工做的时候,最迫切须要解决的问题是:若是人们拍摄了大量的照片,但实际上并不想回头去管理它们,那么咱们将如何标注这些照片呢?这催生了基础的“HCML exercise”:描述理论上的人类“专家”今天可能执行的任务。这个理论包括两层含义:首先,人类完不成的任务 AI 也不可能完成;其次,经过深刻研究专家的方法,咱们能够找到引导信号的数据收集、标签和模型架构。

人类没法完成的任务,AI 也没法完成。

我能想到与此最贴近的例子就是婚礼摄影师,因此我开始用一个很是模糊的招聘信息成功诱惑一名纪录片制做人,一名摄影记者和一名美术摄影师来面试并签了合同,组成团队来回答这个问题:让人难忘的时刻是什么样的?

在评估咱们的照片和视频的质量时,咱们必须认识到被咱们当作理所固然的细微差异、审美本能和我的经历是很是重要的。例如,每当我看到个人小儿子在折腾一个弯折的吸管(最左),或者躲开我不让我亲他的脸颊(中间),我就会感到有点崩溃。当我看到个人大儿子在公园里骑自行车的时候,我很是自豪,由于我记得那一天他终于敢本身骑自行车了。

创建信任

咱们这项工做的出发点,是假设咱们能够向模型输入咱们认为漂亮而有趣的素材,并且它知道如何找到更多相似的东西。咱们曾经谈过关于景深、三分法则、戏剧性照明、讲故事等话题,但我从中学到一点,就是永远不能低估人类运用常识的能力。

这些早期的实验暴露了技术和方法上的鸿沟,这些差距帮助咱们从新评估了这款产品能够实现的目标,以及这项工做的性质。咱们把范式从将 ML 放在显要地位,转变为了解到只有在至关简化的框架下才能有效地学习。基本上,咱们正在经过阅读莎士比亚而不是 Go、Dog.Go! 来教两岁小孩英语。这就是 AI 这个“庞然大物”的神话对我来讲最难对付的地方,即世界上存在一种能够理解全部事物,并能够根据知识进行上下文理解的”智能“这种想法。不可能,这离实现还差得很远。


回归本源

一致性在全部知识教授过程当中都很重要。这就是为何咱们在教孩子阅读和说英语时,尽量花较长时间让他们理解 O-U-G-H(例如 tough, through, thorough)。与"at"的发音联系起来之后,他们就会理解 cat、 bat 和 sat 等单词发音的一致性。

然而,算法不会提供这样的反馈。就算法而言,除非另有指示,不然所显示的全部内容都具备相同的价值。对于 Clips,这意味着每一个示例之间都须要具备一致性。每个单独的框架都须要表明咱们正在试图教授的具体预测,并且每每能够教会它须要忽略什么。

捕捉

咱们须要针对如下几种场景来训练模型:手挡住镜头、快速移动、模糊强度。

咱们以上面的场景做为例子来训练模型,左边是相机放在口袋或手袋里的场景,右边是手指或手掌挡住了部分镜头的场景。咱们没法立竿见影地将模型训练到可以忽略掉某些内容,但从长远来看,这是咱们整个设计的重要组成部分。排除掉无需处理的内容,就能捕捉到更高质量的视频短片。


构图

咱们还要针对稳定性、锐度和取景构图来训练模型。人脸识别模型很容易把处于取景框边缘的人脸与取景框中间的人脸同等对待。

要想让模型保持被摄主体的连续性,须要让主体突出。左上是个人小儿子一直处于取景框中,右上是个人大儿子只有一半时间处在取景框内。

社交基准(social norms)

亲密度是摄影的基础之一。你把相机对准某人,他们作出表情或摆出姿式,默许你的拍摄,并且你正是经过取景器进行取景构图的那我的。而若是使用的是自动相机,那么就须要根据社交线索来判断被摄主体的亲密度,好比你与他们在一块儿相处时间的长短、他们是否常常出如今相机的取景框内。

编辑

在拍摄照片时,多拍几张是件理所固然的事,也就是要保持多元性。咱们会以为已经拍得够多了,但在训练模型时确实须要大量的照片。

咱们会从三个维度考虑多元性:


  • 时间:连续的拍摄时间点是很重要的,千万不要在很长一段时间内什么都不拍。
  • 视觉:场景中的颜色变化表示环境或活动物体也发生了变化,因此要尽可能捕捉到不同的瞬间。
  • 人物:场景中的人物是一大群人仍是一小群人,抑或是只有一我的?了解场景中有多少张人脸,避免错失重要的瞬间。

我把 Clips 放在书架上,从上向下拍摄我儿子的活动。相机在很长一段时间内拍摄到的都是类似的内容。要想避免太多没必要要的冗余但又想不错失重要瞬间,这对于 UX 来讲是个不小的挑战。


信任度和自我效验

咱们在 Clips 上投入,并非由于它具有多么强大的功能,而是由于它可以在设备上进行不外泄隐私的机器学习。相机属于我的物品,咱们不遗余力来保证设备和内容最终都只属于用户本身。没有征得用户的赞成,全部的东西都只会呆在设备上。

概念设计

在考虑信任度和自我效验的同时,咱们也在考虑如何作好 UI 设计。在刚启动项目的时候,咱们只能自做假设一个 AI 产品应该是什么样子的。

在参考将来科技风格的设计时,不少设计师会想到电影《少数派报告》(Minority Report)和《银翼杀手》(Blade Runner)。但若是真的要像《少数派报告》电影里那样向用户展现 UI,看起来真的很疯狂:伸开你的手臂,等上两秒钟,抓一把空气,反方向转动手掌并向右甩。就是这么简单!几乎全部的科幻 UI 都很类似,彷佛交互模型必定要与它所在的系统保持步调一致。在设计的早期阶段,咱们也是这么想的,但后来咱们基于如下几点缘由仍是放弃了这种想法:

  • 咱们在模拟环境里向用户展现虚拟的内容,没法在他们与影像之间创建起真实的链接。这个问题不仅在 AI 中存在,在可用性实验室里,人们也常常碰到这个问题。
  • 咱们天天遇到的人都讲的是相同的语言,对 AI 也都有深刻的思考。若是咱们错过了他们的想法,可能会犯下大错。
  • 咱们认为咱们的新设计很是酷,因此会先自我认同,但其余人可能还不能当即理解咱们设计的含义。

大部分产品都有必定的学习曲线,而有了 AI 的加入,就更要注重了解用户的认知。若是用户对产品感到新奇(图 A),那么就着重强调其信任度。若是用户须要学习使用大量的 UI 元素(图 B),那么就确保用户可以掌握主要的使用场景。若是产品的功能高度动态化(图 C),那么就须要应用用户熟悉的模式。

咱们开始疯狂地下降 UI 的复杂度,将可控性和熟悉度做为体验框架的基础。咱们在相机上增长了一个软件取景器和一个物理捕捉按键。咱们要确保用户可以本身决定拍摄内容的好坏,从视频短片里的静止帧到其中的某一段内容。咱们尽量多地向用户展现拍摄内容,他们能够选择删除不想要的,这样他们就可以更好地了解相机想要捕捉什么,并相信相机在之后可以拍摄到想要的画面。

硬件、智能和内容只属于你本身

在测试 AI 产品的过程当中,咱们有一个重大的发现:在真正成功以前先伪装成功。若是必定要作出选择,那么使用用户真实内容来建立 UX 原型要比使用真实的机器学习模型要有用得多。后者须要更长的时间,而前者可以让你了解用户对产品的期待。

用户在设备上浏览视频短片。左边,用户选择他们想要的短片,并保存到手机上。中间,用户能够打开“推荐”模式。右边,用户能够选择静止帧并保存成图片。

从主观性和我的定制化方面来看,咱们作不到完美,这不该该成为咱们的主要目标。与传统的软件开发不同,机器学习系统是作不到无 bug 的,由于预测分析自己就是一门带有不肯定性的科学。但也正是由于不肯定性,机器学习才变得如此有用。Clips 的目标不只仅是要实现视频的保留、删除、点击和编辑(尽管它们确实也很重要),它更关注原创、共同窗习和改编。


有意图的设计

传统的 AI 是要让机器变得更聪明,而若是咱们是以加强人类的能力为目的,那么就有可能释放出机器学习更多的潜能。机器学习将成为前所未有的创新工具,帮助咱们认识存在于咱们自身和世界之中的模式。咱们有望经过 AI 来塑造一个更加人性化的世界,固然,咱们会时刻记住根植于心中的理念:找出和解决人类真正的需求,增长人类的价值,为了加强而不是自动化而设计。

AI 的做用不该该只是大海捞针,而是帮助咱们拨开云雾,让咱们本身去发现明月。

原文连接:

design.google/library/ux-…

更多干货内容,可关注AI前线,ID:ai-front,后台回复「AI」、「TF」、「大数据」可得到《AI前线》系列PDF迷你书和技能图谱。

相关文章
相关标签/搜索