从大数据到认知计算,将来须要更强的计算能力

认知计算是IBM提出的概念,认为“认知计算”是经过与人的天然语言交流及不断地学习,从而帮助人们作到更多的系统,是从硬件架构到算法策略、从程序设计到行业专长等多个学术领域的结合,可以令人们更好地从海量复杂的数据中得到更多洞察,从而作出更为精准的决策。IBM清晰地把认知计算定义为——具有规模化学习、根据目标推理以及与人类天然互动能力的系统。html

大数据学习

认知计算和大数据分析有何区别?算法

大数据分析属于认知计算的一个维度。与大数据相比,认知计算的范围更广、技术也更为先进。编程

认知计算和大数据分析有相似的技术,好比大量的数据、机器学习(MachineLearning)、行业模型等,大数据分析更多强调的是得到洞察,经过这些洞察进行预测。此外,传统的大数据分析会使用模型或者机器学习的方法,但更多的是靠专家提供。服务器

对于认知计算而言,洞察和预测只是其中的一种。可是,认知计算更为强调人和机器之间天然的交互,这些维度都不是传统的大数据分析所强调。网络

此外,认知计算目前成长很快的一个领域为深度学习(DeepLearning),它的学习方法与传统方法不一样,更多的是基于大量的数据经过自学的方式获得这样的模型,而不须要不少的人为干预,这个从学习方法来说和大数据分析有不少不一样的地方。架构

CPU、GPU、ASIC等传统计算资源的瓶颈机器学习

近十年来,人工智能又到了一个快速发展的阶段。深度学习在其发展中起到了中流砥柱的做用,尽管拥有强大的模拟预测能力,深度学习还面临着超大计算量的问题。在硬件层面上,GPU、ASIC、FPGA都是解决庞大计算量的方案。工具

在2006年的时候,人们仍是用串行处理器处理机器学习的问题,当时Mutch 和 Lowe开发了一个工具FHLib(feature hierarchy library)用来处理hierarchical 模型。对于CPU来讲,它所要求的编程量是比较少的而且有可迁移性的好处,可是串行处理的特色变成了它在深度学习领域的缺点,而这个缺点是致命的。时至今日,据2006年已通过去了十年,过去的十年集成电路的发展仍是遵循着摩尔定律,CPU的性能获得了极大的提高,然而,这并无让CPU再次走入深度学习研究者的视野。尽管在小数据集上CPU能有必定的计算能力表现,多核使得它可以并行处理,然而这对深度学习来讲仍是远远不够的。性能

GPU:虽然走进了研究者的视线,相比于CPU,GPU的核心数大大提升了,这也让它有更强大的并行处理能力,它还有更增强大的控制数据流和储存数据的能力。在 Chikkerur进行了CPU和GPU在处理目标识别能力上的差异,最终GPU的处理速度是CPU的3-10倍。学习

ASIC:专用集成电路芯片(ASIC)因为其定制化的特色,是一种比GPU更高效的方法。可是其定制化也决定了它的可迁移性低,一旦专用于一个设计好的系统中,要迁移到其它的系统是不可能的。而且,其造价高昂,生产周期长,使得它在目前的研究中是不被考虑的。

FPGA是计算的将来?

FPGA:FPGA在GPU和ASIC中取得了权衡,很好的兼顾了处理速度和控制能力。一方面,FPGA是可编程重构的硬件,所以相比GPU有更强大的可调控能力;另外一方面,与日增加的门资源和内存带宽使得它有更大的设计空间。更方便的是,FPGA还省去了ASIC方案中所须要的流片过程。FPGA的一个缺点是其要求使用者能使用硬件描述语言对其进行编程。可是,已经有科技公司和研究机构开发了更加容易使用的语言好比Impulse Accelerated Technologies Inc. 开发了C-to-FPGA编译器使得FPGA更加贴合用户的使用,耶鲁的E-Lab则开发了Lua脚本语言。这些工具在必定程度上缩短了研究者的开发时限,使研究更加简单易行。

Linux On Power+GPU+FPGA=面向将来的认知计算

创新的Linux on power结合FPGA、GPU的计算模式,这也许是面向将来的认知计算最佳架构。

IBM在2015年宣布了与FPGA芯片设计商Xilinx进行“为期数年的战略协做”。两家公司将联起手来,经过OpenPOWER Foundation致力于找到更好的方法处理机器学习、网络功能虚拟化(NFV)、基因、高性能计算和大数据分析等应用程序。

IBM的开发人员将针对OpenStack、Docker和Spark创建解决方案堆栈,结合了基于POWER的服务器,并具有Xilinx FPGA加速器。

此外,McCredie还宣布该公司将把POWER 8芯片同Nvidia Tesla K80 GPUs结合在一块儿,使用NVIDIA的高速NVLINK互联。两家OEM——Penguin Computing和E4 Engineering将会把基于OpenPOWER设计理念的系统推向市场。

据IBM内部测试显示,与基于英特尔E5-2699 V3处理器的服务器相比,新Power Systems LC服务器可以以不到前者一半的成本运行Twitter简讯分析、网页视图显示等数据密集型工做负载,为客户每一美圆的成本支出提供领先于前者2.3倍的性能。凭借其高效率的设计,LC服务器在相同的机架空间里可以比基于英特尔处理器的同等服务器多运行94%的Spark社交媒体工做负载。

用于商业计算和高性能计算的2插座2U Power Systems S822LC配备最多20个核、1TB内存和230GB/秒内存带宽。用于高性能计算的S822LC还配备NVIDIA特斯拉加速计算平台的旗舰组件——两个集成的NVIDIA Tesla K80 GPU加速器。与配置相似、基于x86架构的E5-2699 V3服务器相比,两款S822LC产品可以提供领先于前者逾2倍的单核性能、高于前者40%的性价比以及在满内存配置状况下超过2倍的内存带宽。

本文转载自36大数据

2016企业革新方案大放送,慧都联合IBM为你量身打造大数据专属解决方案!详情请咨询在线客服>>>

相关文章
相关标签/搜索