海阔凭鱼跃:记一场工业场景下的AI技术实践

本文由 【AI前线】原创,原文连接:t.cn/RHoI2Rcgit


做者|朱武算法

编辑|Emily编程

AI 前线导读:“相好比火如荼的消费级人工智能,AI 技术在工业和制造业的发展与落地却显得不温不火。工业智能虽隶属于弱人工智能,但在某种程度上,其高度的「自治性」与「独立性」应被施以更多关注。例如,工业机器人一般被设计用来执行特定的细分任务,而现代机器人则被授予了新的使命:作出实时决策。缓存

在采访今天的主角——天泽智云首席架构师朱武 前,工业智能、虚拟智能体、工业互联网等概念似乎如盘根错节般难以被释清,这同时也反映了工业智能背后的技术发展成为咱们关注的空白区之一。因而,带着对工业场景的机理、工业智能背后的数据提取、建模、训练等技术挑战、智能决策系统技术架构的疑问,咱们开启了此次好奇心之旅。”安全


开篇:为工业智能正义网络

还记得在《机器之心》中,做者雷•库兹韦尔阐述了一幕大胆的预测:将来的世界,人类和机器将难分彼此,人类将再也不是万物之灵。架构

若是将人工智能应用看做最终呈现的产品,那么决定“产品质量”各项要素的五个方面则造成工业智能的五要素模型——“人机料法环”。在旧有理解中,人做为活动第一驱动力而存在,与其余四要素并不一样属一个范畴内。但在工业智能实施的状况下,生产组织方式发生了变化:并发

朱武解释说:“在这个模型中,活动做为一个虚拟的智能体,人在活动中的重要性弱化,活动的第一驱动力来自于反应活动的数据(知识)。这是智能在工业上应用所带来的最大变化和意义所在。”虽然从目前技术发展角度来讲,绝大多数工业场景应用还达不到这种彻底虚拟、彻底智能的程度,但朱武强调,生产组织方式变化对应着智能应用方向的革新,从而直接影响了分析、建立系统的方法和流程。框架

而说到这里,咱们并不是想强调假大空的概念。定义工业场景的机理对于构建活动虚拟智能实体具备很是重要的基础做用。机器学习

能够看到,国内目前并不乏为工业领域提供 AI 解决方案的企业,林林总总包含了大数据公司、云计算厂商等同胞,但可能多半并不能清晰地定义工业场景的问题域,或很难从特定知识和数据维度进行工业场景分析。

好比用户须要对生产线进行优化,那就须要对具体产线进行分析,影响产线的主要是设备问题、工艺问题、仍是人员问题?这是界定问题域的过程;再好比肯定了问题是预测齿轮箱的故障,那就须要知道齿轮箱的构造、运转方式及工况,故障模式和相应的故障现象,这是为分析问题所涉及的实体对象的领域知识。

总结来讲,工业场景的机理定义须要依赖于合理层次和颗粒度的问题定义,得到相关性的数据集,最终造成问题到数据集再到特征的映射。

但同时,目前的工业智能还处在初级阶段,大部分场景下还作不到彻底智能化,但只要具有活动优化、自适应等特色的系统,均可以属于工业智能应用的范畴。


黄沙百战穿金甲——工业智能实现背后的技术挑战

问题域的肯定和分析方法等众多环节的联结,会致使工业智能实现上所面临的技术挑战或远高于消费级人工智能所对应的难题。

例如,在 2015 年通用电气(General Electric)推出 GE Digital 时,GE Digital 的 CTO Harel Kodesh 就提出过:工业数据不许确、工业智能对风险控制和响应能力的高要求、终端处理能力的限制、复杂模型必须被解释等显示了工业智能与消费人工智能的重要区别,这也致使了在数据、算法和模型训练上工业智能所要开辟的一些「新领域」。

在采访中,朱武为咱们解释了数据特征提取、建模等层面的技术挑战:

工业数据的多源性、复杂性和动态性强,好比柴油机气缸排气温度,取决于燃油、燃烧、进气温度、封闭性等等,所以,特征提取要求在高背景噪声下必须实现准确且快速的降维。另外,在数据建模及训练层面,工业应用的碎片化、个性化以及结果的专业性,须要建模及训练在总体和个体、通用性和个性化之间取得均衡。

那么,实现人工智能所依赖的关键技术多如牛毛,数据感知、大数据、机器学习、自动控制、仿真等该怎样地更好应用在工业智能中呢?朱武认为,从工程实现的角度,工业智能实现的关键有以下几步:

  1. 定义工业场景:正如上文所说起,问题域所涉及工业场景定义的准确性和完备性决定了该问题在多大程度上被解决的可能性;
  2. 数据的完备性和质量:工业现场数据通常带有不少噪声,而数据范围和质量决定了后续处理的难易程度和最终结果的准确性;
  3. 智能应用支撑环境:工业智能应用自己就具有碎片化、个性化、专业化的特色,如何提供快速有效的应用实施环境,包括数据环境、模型研发实验环境、应用部署环境等,决定了工业智能应用的推广和客户接受速度。

美国早在 2006 年提出了 Cyber-Physical System(CPS), 也就是“信息 - 物理系统”的概念,并将此项技术体系做为新一代技术革命的突破点。

依照美国 NSF 智能维护系统中心创始主任李杰教授、天泽智云 CTO 刘宗长共同发表的《工业大数据:挖掘“不可见世界”中的价值》一文中的阐述,CPS 是一个具备清晰架构和使用流程的技术体系,针对工业大数据的特色和分析要求所构拟的技术体系,其可以实现对数据进行收集、汇总、解析、排序、分析等全套处理流程,实现对工业数据进行流水线式的实时分析能力,并在分析过程当中充分考虑机理逻辑、流程关系、活动目标、商业活动等特征和要求。所以可做为工业大数据分析中的智能化体系的核心。

                                                 CPS 的 5C 架构


因而,智能决策系统孕育了

在朱武看来,虽然 CPS 带有仿真环境的属性,但其很大程度上具有了智能性,“在工业场景下,不少细节须要机器或系统具有自动学习与调整的能力”。此外,CPS 内含协做概念,是实体虚拟空间的映射,而且使得实体设备与虚拟设备之间造成关联性和相互影响——朱武称之为自协做。

而工业智能机理的特定性、工业智能应用实施速度的提高(避免算法选型、数据诊断处理的大量耗时)以及标准化其实施和方法的需求,使得智能决策系统的研发和上线成为必要,天泽智云工业智能决策系统的诞生也是基于这样的背景:

  1. 为将工业领域知识模板化:朱武强调,工业智能的决策分析比较依赖于工业相关的领域知识、计算机科学和智能建模技术,但同时具有这三个方向知识的人员较少,因而将工业领域知识模板化将成为必然,从而下降实施工业智能的难度;
  2. 缩短工业智能应用研发和部署的周期:工业智能应用讲究快速反应的能力,实施速度的提高,若是在一套系统中像算法、软件实施、系统实施这类的技术层能够公用,那么能够大大缩减开发时长。
  3. 于是天泽智云就让智能决策系统提供数据接入、数据存储、模型发布和应用发布的功能支持,基本分离计算机科学和数据科学,从而数据科学家能够专一模型开发;
  4. 支持构建标准化的解决方案:朱武分析说,目前对于不一样行业有定制化需求的不一样企业,因为数据环境、数据质量及业务应用的复杂程度不一样,从定义模型到应用的部署实施是须要 2-3 个月的周期,遇到新的应用场景则会耗费 3-4 个月。工业场景的不肯定性太多,于是在智能决策系统中设定支持相关方法如特征提取、数据处理、场景定义等实施显得十分必要,一个标准化的实施方法和解决方案能够推进整个行业的发展,从而摆脱工业智能初级阶段「独乐乐」的窘境。

目前,CPS 的 5C(智能感知层、信息挖掘层、网络层、认知层和配置执行层)在智能决策系统中有这些对应实现:

  • 对于智能感知层:智能决策系统经过边缘计算端点支持现场数据的接入;
  • 对于信息挖掘层:支持任务化的数据迁移,支持各类数据源的动态接入和挂载;
  • 对于网络层:提供基于实体语义的数据访问;
  • 对于认知层:支持算法和模型的测试、试运行和发布;
  • 对于配置层:支持各类业务服务的集成。

但同时,朱武也坦言,受制于现阶段国内工业智能发展的局限性及各场景间的零碎性,再加上 CPS 体系的复杂性,目前的智能决策系统都不能称之为 CPS 的所有实现。


智能决策系统如何用技术实现智能决策?

因为受工业环境不一样种使用场景的约束,天泽智云会根据部署环境和业务场景的不一样采用差别化的技术实施手段,于是,智能决策系统的技术架构也须要根据特定情境来调整。下图是天泽智云智能决策系统顶层功能架构图的全貌:

                                                 天泽智云智能决策系统功能架构

从功能架构图中能够看到,智能决策系统分红了数据分析与设计、计算环境、CPS 协做集成引擎、服务环境、数据接入、数据持久化及业务应用 APP 等多个模块。

朱武补充道,抛开功能架构不谈,智能决策系统的技术架构设计需重点考量三点:

  1. 关注技术的可替代性。由于新技术的不断迭代、专为工业场景定制的 IT 通用解决方案的缺失以及各家使用技术栈的不一样,决定了架构设计上不该作到高技术耦合性。
  2. 实现 CPS 概念的映射。从数据组织、服务组织层面上看,朱武认为应使总体的决策系统体现出动态协同或自组织概念。
  3. 将计算环境与服务拆开。朱武解释,拆开的缘由是想体现两种不一样性质服务的概念。通常的服务环境并发性是横向扩展的,但计算环境中的服务执行在扩展性和并发性上体现的策略不一样,另外再加上算法间的强依赖性,于是致使必须将计算环境与服务环境区隔开来。以实现风场风功率预测功能为例,其实现以下图所示:

整个结构分为对外的基于功能切面的服务与内部基于虚拟实体资源组织实现。在外部请求时,首先经过 API 网关,基于服务注册与发现,查询与定位服务,当风功率预测服务未启动时,服务注册与发现通知服务调度,服务调度建立并启动风功率预测服务。风功率预测将具体功能,如风场总输出功率预测、单风机输出功率预测等,请求各自的虚拟实体资源。虚拟实体资源,能够视为具有对外提供数据能力的虚拟化设备,该虚拟设备从逻辑上组织相应的数据接入、基于数据持久化的数据集、相应的计算任务,同时,可按照用户定义的策略,结合数据接入的实时状态数据,自动执行、管理其行为。


智能决策系统中的高并发和高可用问题

工业场景中,数据质量、数据全面性和数据精准性问题是不少企业的「烫手山芋」,“利用数据建模的手段解决某一问题时,须要获取与被分析对象相关的全面参数”,这也使得智能决策系统的计算环境一环须要面临高并发和高可用的挑战。

固然,须要澄清的一点是,这里指的高并发和高可用与传统意义上的意思有所区分。按照朱武的解释,工业智能的运行场景一旦场景明确化以后,并发量的大小是能够提早预知且明确的,因此高并发的严格指代是——考虑在不一样业务场景下不一样的负载该如何设置,如何优化调度策略和服务组织,使得单个应用实例跑的更好,从而解决资源的高效利用。
一样,高可用一般指经过设计减小系统不能提供服务的时间。但工业智能计算环境中因为算法装载等问题,致使没法全然判定服务出错的时间,或实现对服务有效性的精准判断。

工业场景,解决高并发问题实质是提高效率,而提升效率的关键点之一即实现数据的内聚性。智能决策系统除了常见的设计策略外,根据工业场景的特色,朱武团队采用了数据区块化的设计方式:

工业智能应用通常是按照实体对象去采集、存储和访问数据,所以数据具有局部化特性。

朱武解释说,对于采集数据,一般状况下是在用分布式缓存 Redis 前用哈希映射到某一数据节点,而且最好使可执行节点和数据在同一个本机上,实现一样的机制映射,同时再设置相对合适时间阈值,这样就能够作到更好的分配。

另外,还可经过资源抽象的方式解决高可用问题,即让运行资源和运行实体分离来,动态按照需求调配运行资源。

该环节实际上可理解为计算节点重复利用问题,尽可能让计算节点按照实际需求而分布。例如,请求接入后可从资源管理中得到资源空闲结果,采用调度策略找到相对应的节点,从而直接与计算节点创建关联。执行过程当中,还可经过服务监控和灵活调度及时发现问题。

所以,在智能决策系统中,计算环境做为提供算法、模型的管理、运行和调度平台,(从业务场景来看)须要具有以下特性:

  • 算法、模型依赖于不一样的运行环境和组件包,集成时的形式存在多种形式,所以 计算环境需具有不一样编程语言与框架的算法、模型集成能力;
  • 计算环境应采用特定的算法、模型状态管理机制,用于服务治理。 对一部分算法、模型的执行,不太适用时间阈值的方式;
  • 算法、模型执行效率,涉及算法、模型间的数据共享和协做,以及算法、模型内部中间结果的传递策略;
  • 计算环境须要部署在不一样的运行环境中,要求 计算环境可以根据实际需求伸缩和选择性部署的能力。

数据接入实现了现场数据、系统边界外数据接入系统的能力,根据工业数据应用的特色,数据接入须要具有以下特性:

  • 多种协议集成和采集策略的实施:IoT 在接入数据层会有各类各样的协议,所以须要将不一样的协议进行集成。另外就是采集策略也是变幻无穷,但要想推动标准化和品牌化就会使得不少采集策略失效,于是目前的解决方案也只能靠人工解决。
  • 多种时效性数据的双向传输: 在天泽智云目前的业务场景中,有上传和下传两种时效性传输。上传涉及到状态数据、振动产生的文件或数据集等,下传数据包括指令数据和更新。
  • 错峰控制: 在上传和下传实时数据时,可能会遇到数据积累和堵塞状况。底层传输机制的实如今部分 IoT 组件上并未最大程度上优化实时性。所以,业界有用到组态软件来解决该类问题的方案。但组态自己来说是组织态势,组态软件是指可配置、可调整的软件系统,并不指实时性。因此数据接入的时候,很容易会面临 物理上同一个链路的竞争,因此须要适当控制。

此外,数据接入还面临到不稳定状态下的数据可靠传输、数据预处理(包括质量过滤)、实体信息和背景信息融合等多维度的技术挑战。

以智能风场的能量管理系统为例,其须要的数据接入以下图:

从上图能够看出,其数据来源、数据链路、数据通讯协议及时效性、安全性约束的多样性。目前,天泽智云是软硬结合来解决和完成数据接入的问题。经过边缘计算、工业物联网网关、PLC/SCADA 这些硬件设施解决部分接入,在软件层面经过通讯代理、总线技术解决另外一部分数据接入。总的来讲,仍是亟需行业和政策的共同推进,从根源上统一技术栈,实现智能接入的真正落地。


如何将人才真正「适配」到工业智能中

在采访过程当中,朱武与咱们屡次谈到了工业场景机理的特殊性和差别性,两者决定着工业智能的推进不只须要从业人才具有数据、算法等技术技能,同时还要面对着各类工业领域新知识的「侵袭」。这就对挑选合适人才、使新晋成员更快得到成长等方面提出了更多挑战。

朱武重点阐述了他们的三点培养方法:

一是给予成员清晰的定位,规划、设定其所处的技术维度,在技术上为其划分精确的方向和专业,与其共同谋划好职业成长路线;朱武团队内部目前没有采用一带一的传统成长计划,而是一般分三人小组,分配任务时以团队为单位进行,从而促进其小组内部的技术交流氛围,让每一个人得到更快的成长速度。

二是强调技术分享和轮岗制。朱武团队很鼓励在某一个技术领域有了必定积淀后,为得到更充分的应用和解决方法而参与到另外一个技术领域的构建中,从而实现技术上的自由转换。

三是充分信任,作到合理的任务分配。工业智能没有更多的捷径和投机取巧的方式实现落地,不管在技术层的突围仍是人才层的吸纳,脚踏实地是关键。这也是采访中朱武不断强调懂工业机理重要性的缘由。


采访嘉宾介绍

朱武,天泽智云首席架构师,承担过多项国家重点型号科研项目,擅长工业领域的软件系统开发、测试和架构设计。曾就任于中国船舶系统工程研究院,主导并实施海军后勤装备保障体系信息化建设;做为总架构师与 IMS 共同合做,参与船舶智能运行与维护(SOMS)系统等多个智能化系统的架构设计和实施。

关注后回复「AI」你懂的

相关文章
相关标签/搜索