英特尔发布"概念验证"白皮书:AI人工智能落地,如何辅助决策者将价值最大化

人工智能算法已经出现多年,可是直到最近,人工智能的价值才开始在企业中获得快速扩展。前端

快速扩展的缘由基于两方面:一方面处理和存储数据的成本都已大幅降低。另外一方面,计算科学家已经改进了人工智能算法设计,包括神经网络在内,使得训练模型得到了更高的准确度。算法

人工智能系统首先学习数据,而后从中推理出结果安全

为了进一步加快人工智能普及速度,推进了基础设施创新,业界和学术界纷纷将与人工智能有关的功能直接嵌入到硬件之中,例如:最新的英特尔®至强®可扩展处理器为普遍的人工智能工做负载提供可扩展的性能,在深度学习模型训练和推理中提供突破性的性能,英特尔®Nervana™ 神经网络处理器则采用专为神经网络构建的新型架构。性能优化

专业硬件的加持,使得人工智能潜力明显,可是许多企业尚未开始采用人工智能,其采用速度也比不上媒体和学术机构在报告中推测的速度。网络

通过媒体调查,这些企业担忧普遍的潜在机遇带来的挑战。架构

那么,什么样的机遇可以带来最好的结果?如何确保能取得成功的结果呢?框架

英特尔为此提出了一套“概念验证(PoC)”的解决方案,而且详细撰写了一套“白皮书”,可以帮助决策者回答这些问题,同时最大化价值,最小化风险。函数

注:概念验证(POC)是一种“封闭”而有效的解决方案,从了解要求一直到实现成功,可根据明确的标准对该解决方案进行评估和测量。对于任何人工智能项目或程序,概念验证让决策者可以:更快收获价值、获取技能和经验、测试硬件、软件和服务选项、确认和解决潜在的数据瓶颈、突出人工智能对 IT 基础设施和普遍业务的影响、提高人工智能的积极印象,提升用户的信任度。性能

概念验证具体来讲分为五个步骤。第一步确认机遇、第二步肯定问题的特征并分析数据、第三步架构和部署解决方案、第四步评估商业价值、第五步纵向扩展概念验证。大数据文摘也将白皮书简要介绍以下。学习

第 1 步 确认机遇

请你务必从一开始就明确了解你但愿利用人工智能达到哪些效果,为什么它对你的企业相当重要,以及你如何确保它可以提供所需的功能,这些很是重要。若是你还没有明确能从人工智能中得到哪些益处,你应该实施评估,看看人工智能可在哪些地方产生立竿见影的效果:

  • 思考行业中的其余企业都在使用人工智能作些什么。
  • 在你的企业中,看看哪些方面存在明确须要解决的问题,或哪些方面能从人工智能中获益。
  • 在工做中利用现有的专业知识库,使用内部已有的技能和经验。

在肯定了哪些方面能从人工智能获益后,能够根据几项标准来测试各个机遇。这项工做无需花费很长时间,而如下问题能够帮助你确认你的组织在规划方面的不足,以避免仓促启动人工智能项目:

  • 你是否明确知道本身想要解决的问题、其对应的具体要求,以及你将如何衡量成功?你是否考虑过或曾部署其余解决方案来解决此问题,后来由于倾向于人工智能而放弃这些解决方案?
  • 是否明确限定了机遇的范围?例如,你是否能简要说明这个机遇会使用到的数据集、关键组件、将会受到影响的人员,以及其余依赖项?它是某个更大解决方案的一部分吗?
  • 你是否具有让它成为现实所需的技术资源和资金?你是否可以不受技术、合同或其余因素的阻碍,直接使用你所需的数据源?
  • 对业务的有利影响是否足以抵消所付出的努力?那些容易看到的成果很是重要,有利于提升用户对人工智能的信任度,让更多的利益相关者参与进来。
  • 推进力和得到的支持是否足够(例如高层的支持)?受到影响的业务部门是否全力参与来解决这个问题?
  • 时间安排上是否合适?是否明确指定了交付团队?这个团队是否具备足够的时间、技能和动力来完成这项工做?
  • 组织是否具有更普遍的数据科学和 / 或人工智能战略?此战略是否与其目标一致?组织目前已具有哪些数据科学基础设施和专业知识?
  • 概念验证成功完成以后,后续准备怎么作?是否有资金用于维护或扩展该解决方案?负责运营的 IT 部门是否获知了基本状况并准备好参与其中?

第 2 步 肯定问题的特征并分析数据

在你确认和测试过机遇以后,接下来可将注意力转向了解和详细阐述待解决的问题,将其映射至更普遍的类别,例如推理、感知或计算机视觉。

组织遭遇的部分挑战,尤为对于尚处于人工智能早期阶段的组织而言,就是内部没有足够的技能。

在你的人工智能工做流程中,这也是思考更多可能会给解决方案带来影响的技术问题的绝佳时机。例如:

  • 你是否倾向使用某些硬件或软件?为何(基准测试数据、TCO、首选供应商)?
  • 安全 / 监管 / 数据 / 其余方面的需求是否更倾向于选择本地系统而不是云?
  • 你的解决方案是在本地本身维护,仍是部署到数据中心中?
  • 当前数据中心的利用率是多少?性能 - 功耗比有多重要?
  • 你会按照什么频率和数量为训练 / 推理提供新数据?
  • 在静态和动态情形下,如何保持原始数据和生成的洞察始终安全?

第 3 步 架构和部署解决方案

下一个问题是,如何设计和部署已经过概念验证测试的解决方案。如图 3 所示,这由一个技术栈组成,包括:

  • 基础产品和系统基础设施
  • 人工智能特定的软件,用于推进基础设施建设
  • 起支撑做用的人工智能框架,用于为计划的解决方案提供支持
  • 虚拟化技术、前端软件和 / 或硬件

在这个阶段,你能够考虑究竟是构建、购买或再利用硬件和软件,仍是利用云服务。

即使是按照最佳实践构建和测试的基础设施和软件,仍然须要考虑人工智能的各类要求。尤为是持续提供高质量数据这一要求。数据科学家可以与 IT 系统架构师合做设计从数据中心到边缘的部署架构,而且考虑软件集成、网络链接、硬件问题和其余各方面。可能须要测试多个选项:应该采用测试加学习的方法,以便能获取更多的经验。

完成以后,你能够处理解决方案的其余人工智能相关元素——构建模型、训练和调优。

构建模型

模型构建属于人工智能的核心任务。数据科学家参与其中,使用训练数据和管理参数来实施迭代测试。这样,在他们发送模型用于更普遍的训练和调优以前,能够检查模型的初始融合准确性。

训练和调优

训练和调优是人工智能工做流程中计算密度最高的部分。在这一阶段,数据科学家须要肯定在哪些参数下,模型可以基于所提供的训练数据实现最有效的融合,同时解决做业调度和基础设施管理等常见的传统 IT 问题。

这个过程很是耗费人力,数据科学家须要花费大量时间来手动整理数据并执行数百次试验。

第 4 步 评估商业价值

做为解决方案设计的一部分,你须要定义概念验证的评估标准:对于工程师,这些标准能够转化成可以设计、衡量、持续自动测试的评估标准。

现人工智能解决方案架构能够表示为堆栈

如下这些评估标准可用于评估商业价值:

  • 准确度:解决方案提供的结果和洞察是否正确?是否能够重复?
  • 完备性:这种解决方案是否正确使用全部数据源?
  • 时效性:是否在须要时,按照须要提供洞察?
  • 除此之外,不管其运行情况是否符合预期,此解决方案还需遵循其余标准:
  • 扩展性:若是数据量或用户数量随时间不断增长,或者急剧增长,该解决方案是否能继续发挥做用?
  • 兼容性:解决方案是否为开放的,而且能使用标准协议与第三方数据源和服务集成?
  • 灵活性:若是数据需求或模型发生变化,解决方案可否适应不断变化的环境?
  • 工程性:可否简单快捷地调试训练模型中的错误输出?

最后,须要根据人工智能领域广为人知的“可解释性”(即决策质量)来评估解决方案的需求。与可解释性有关的标准包括:

  • 偏见:如何确保人工智能系统不会基于训练数据、模型或目标函数的缺点对世界存在偏见(或者对存有偏见的世界保持公正的态度)?若是其人类创造者下意识或潜意识地存有偏见呢?
  • 公平公正:若是决策是基于人工智能系统制定的,如何确认这些决策是否公平公正?在这种环境中,公平公正意味着什么——对谁公平?
  • 因果联系:该模型除了提供正确的推理以外,是否还能解释一些基础现象?
  • 透明性:针对基于人工智能的洞察给出的解释,用户可否理解?在什么样的状况下,所发现的结果能够被质疑?
  • 安全性:不管用户对得出结论的过程了解与否,如何增长用户对人工智能系统可靠性的信心?

第 5 步 纵向扩展概念验证

现代平台的性能优化

截至目前,你已经定义了问题,设计了解决方案,分析了数据且创建了模型。概念验证已成功构建、测试和部署。那接下来应该作什么呢?

积极的用户体验有利于提高用户需求,以得到更大的成功。可是,概念验证也会所以遭遇风险,成为受到过多关注的牺牲品。你能够采起一些措施,确保你的概念验证持续保持成功,为更普遍的人工智能战略提供支持:

  • 纵向扩展推理能力。人工智能不是以线性方式扩展的——例如,从单节点配置迁移后,50 个处理器并不必定会带来 50 倍的性能。你仍然须要利用在单节点配置中采用的不少方法来测试和优化多节点配置。
  • 纵向扩展更普遍的基础设施。为确保人工智能得到成功,你须要验证推理链路中的每个环节。检查现有的技术平台、网络和存储,以增长可用的数据量,改善时效性和延迟。此举将最大限度减小将来遭遇瓶颈的可能性,同时最大限度提升从数据源中得到的价值。
  • 调整和优化概念验证解决方案。随着时间推移,你会积累更多的技能,用于提高和加强你所部署的人工智能解决方案。为了得到更好的结果,你能够优化数据监管和打标签等领域的软件,也能够尝试训练和部署新模型。
  • 横向扩展至其它业务场景。你的概念验证可能涵盖其它业务领域的应用,例如预测性维护解决方案以前被部署到制造环境的某一个区域,如今可对其实施扩展。你能够采用一组方法来管理如何在更普遍的用户群内扩展概念验证。
  • 管理和运营规划。就本质而言,许多人工智能应用案例都要求系统实时执行推理,而不是在离线或批处理模式下执行。此外,随着时间推移,可能须要从新训练并更新模型。这些因素对服务交付提出了一些额外要求。要确保预先分配了足够的时间和技能资源,以便继续提供概念验证。

本文内容来自英特尔

相关文章
相关标签/搜索