物联网:数据淘金——从数据中挖掘有效信息

欢迎你们前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~架构

现在是信息时代,得数据者得天下。然而,只是“有”数据还不够,数据的“准确性”和数据的“分析”也是相当重要的。爱因斯坦也说过:“能用的不必定有用,有用的也不必定能用。”机器学习

“数据”和“信息”不是一码事。“数据”说的是一堆未经处理的原始测量结果,咱们要分析它,取其精华去其糟粕,以用于得到有用的信息。因此我们常说的“信息过载”其实不对,“数据”可能会过载,但“信息”越多越好。数据自己不必定有用,由于若是没有通过适当的筛选,数据可能像假新闻同样,使咱们误入歧途。工具

过去十年间,咱们的数据量实现了爆炸式增加。《纽约时报》报道,2005年全球数据总量达到1300亿GB。如今的公司常常要处理数以PB记的数据。随着数据源的飞速增加,数据的获取速度也愈来愈快。科技进步如此迅速,转眼已经是沧海桑田。据@HistoricalPics推特所述,1956年一个5MB硬盘要超过2000磅重,IBM要用一架飞机才能运输!低头看看巴掌大的手机,不禁得心生感慨。学习

随着对人们活动和传感器的测量,数据类型也在不断增长。而咱们要记住:数据,只有通过了分析,变成了信息才有用。大数据

物联网的优点在于它能实时获取、组织数据。若是架构正确,物联网能够把数据变成有用的信息,用来决定下一步怎么办。优化

Kristian J. Hammond在《哈佛商业评论》中曾掷地有声地说:“大多数时候,咱们都知道咱们想从数据中获得什么:咱们知道须要分析什么东西、须要寻找什么相关性、须要怎么比较。咱们能够把数据交给一个能够胜任这些工做的机器,而后让它用人类的方式、用天然语言告诉咱们结果。这样,咱们就能稳定、迅速地从数据中提取到大量有用信息——但现在尚未实现。经过辅以机器的力量,咱们能够全自动地从数据中淘金,让冰冷的数字变成感性的认知。“ui

如何发现数据的内涵?

物联网以前,分析传感器各式各样的海量数据很是困难。经过物联网技术,咱们能够把机器获得的数据放入数据池自动分析,以决定下一步须要对数据和程序作些什么。物联网不只收集、分析数据,它还会自我提高。云计算

在介绍具体步骤前,咱们先明确两个在讨论数据传输时经常使用的术语:“北向(northbound)”和“南向(southbound)”。“北向数据”是指从设备发出,经过网关,送至云端的数据,通常是遥测数据,也多是命令和控制请求。“南向数据”则是从云发至网关,或者从云经过网关发至设备,通常是命令和控制信息(如软件的更新,请求、更改配置参数等)。blog

如下是利用南、北行信道,从探测数据中找到有用信息的方法:ip

  • 第一步:传感器发出北向遥测数据。根据架构的不一样,这些数据会被预处理,而后发送到位于传感器附近的数据存储器(好比一个网关)。
  • 第二步:在网关这个临时节点上对数据进行必定量的分析,你能够在这处理数据(例如汇总数据,或者转换数据,为数据中心或云深刻分析作好准备)。而后,把在网关上处理的信息和以前的精确结果比对,就是在历史信息中进行相关性匹配。发现的模式能够做为咱们行动的依据。但除了发现已知模式,你也想找到你不知道的东西,想发现新的相关性和结论。例如,你可能不知道当气温降到10℃如下时,医生开出的抗流感处方会增长30%,而同时鸡汤、纸巾的销售额也会10天内上升。你之前可能没注意到这些关联,但如今有了物联网,你就能够用这些作出新的商业决策。
  • 第三步:利用新的信息,您就能够创建一个规则。例如,当传感器发现温度已经降到10℃如下时,就让仓库把鸡汤和纸巾运到码头附近。这样,你就把信息变成了可监控、管理、执行的行事规则。
  • 第四步:最后把制定好的规则付诸实践。就是如图所示的迭代过程。

开源何益?

开源软件项目提供了标准化的工具包(例如Camel、Drools),你能够用它处理、操做数据。Apache Camel是一种基于Java规则的路由和中介引擎,具备能够处理数据的企业集成模式。它经过“开箱即用”(out-of-the-box)的信息中介、路由、数据转换,能够联网解决方案的开发。我认为最好经过Eclipse IoT工做组项目(如Eclipse Kapua、Kura)在IoT中使用Apache Camel。

JBoss社区的Drools是一个内置了规则模板的业务规则管理系统,你能够用它规定在什么状况下应该采起什么措施。Drools经过定义明确的DSL(域特定语言)来实现物联网所需的规则和优化规则引擎所需的可扩展性。它还附带一个名为Workbench的GUI,可让开发者很是简单地建立、编辑规则。

把数据转化为有用的信息是全部物联网工做的核心,而经过开源软件能够实现这一目标,这有助于加速将物联网付诸实践。

 

问答

基于云计算的物联网应用场景有哪些?

相关阅读

对大数据和物联网环境中数据科学自动化的看法

机器学习,流式IoT和医疗设备互联

使用技术拯救天然:物联网版

 

此文已由做者受权腾讯云+社区发布,原文连接:https://cloud.tencent.com/developer/article/1100141?fromSource=waitui

相关文章
相关标签/搜索