百度天算,大数据和人工智能的全面开放

如今,大数据技术已经在各行各业开始成熟,并在各行各业发挥着重大的作用,大数据已经成为推动社会前行的巨大推动力。从简单的外卖到电商产品推荐,从复杂的人脸识别到导航地图中的实时路况,路况预测,无一不隐藏着大数据的身影,正因为如此,7月13日,百度在北京召开的2016百度云计算战略大会上,宣布推出百度大数据智能平台——百度天算,将百度的大数据和人工智能能力向社会全面开放。

百度开放云总经理刘炀表示,百度天算是百度开放云提供的智能大数据平台,依托百度为超过300万用户提供的大数据分析经验,百度天算智能平台为用户提供了完备的大数据托管服务、智能服务以及众多解决方案,帮助用户实现智能业务,引领未来。

为全产业赋能

俗语说人有千算,天则一算,人算不如天算,过去,由于人们获取信息的手段匮乏,处理信息的计算能力弱,因此无法对错综复杂的情况进行处理,这句话或许是对的。而今天,在大数据和人工智能时代,这一切已经发生了彻底的变化,通过云计算,我们可以获得非常强大的计算资源,进行非常复杂的运算,通过大数据技术,我们可以对千变万化的复杂情况进行非常有效的处理,分析出蕴藏在复杂信息后面的必然规律,人算胜于天算的时代已经来临!

百度对大数据技术的研究由来已久,百度已经在自己的20多款产品和超过300万的企业用户中应用了大数据和人工智能技术,例如很多人都认为非常简单、没有什么技术含量的百度外卖,其实背后都隐藏着非常复杂的大数据分析和人工智能技术,如何将客户的点餐准确按时的送到用户手中,更多考验的是背后调度技术的功力,而在调度技术中则涉及如何预测菜品的烹饪时间,如何规划送餐骑士接餐和送餐的顺序,如何预测送餐的时间等等,而这一切的背后都是依托于百度强大的大数据和人工智能能力。
图片描述
正如大家所熟知的那样,百度一直在创新。百度拥有全球最大的神经网络,支持万亿级别的传输,百度MR集群的日均作业数超过百万,百度跨IDC统一资源管理数十万台服务器,百度存储管理的数据超过1000PB,百度MR的单集群规模超过数万台服务器,百度还拥有国内首个自研大规模深度学习平台、跻身世界TOP10排行榜的MINVWA超级计算机以及千亿级的样本特征和PB级的数据模型训练能力,百度将这些能力和经验汇集在一起,共同构建了百度大脑,而百度大脑拥有听、视、说、规划决策、推荐预测、行动控制等各方面的大数据分析和人工智能能力。百度也希望通过这些技术和能力,能够为全产业赋能,能够帮助整个产业向前发展,这就是为什么百度推出天算智能大数据平台,并将自己的大数据和人工智能平台技术对外开放的原因。

坚持开源开放

实际上,目前,天算大数据平台已经能够提供从数据收集到传输存储,从云端的大数据处理到个人的AI服务,从语音识别到智能问答,从生命科学到金融服务等各种场景的应用,并最终可以实现对所有的应用场景全面覆盖。
图片描述
然而,大数据涉及的技术和应用领域非常复杂,目前能看到的还只是冰山一角,未来还有很多新技术和应用会在百度天算平台上进行开放。刘炀认为,对于复杂的大数据业务的推广,百度需要坚持两个核心点。

第一是生态,百度希望通过自身的产品建立起健康的大数据生态圈,在建立大数据生态圈方面,百度将坚持开源和开放。因为百度开放云的思路就是拥抱开源系统,拥抱开源生态,而且在这个生态中已经聚集了大量的人才、资源和应用场景,所以拥抱开源,能够让百度更好的融入到开源社区,能够站在开源社区的肩膀上继续前行,当然,百度通过拥抱开源,也可以更多地为开源社区做贡献。实际上,百度内部也在大量使用开源产品并由此获得了非常丰富的经验,百度也将很多自有的技术融入到了开源产品中,未来百度也会更多地将各种自研能力进行开源。

第二是开放,百度拥有非常开放的心态,这从百度开放云的名字就可以体现,百度将会一如既往的与生态圈中的各产业合作伙伴进行深度的合作,共同建设和完善这样一个大数据的生态圈,此外,百度也希望可以降低整个行业使用大数据和人工智能技术的成本,因此,百度开放云选择了特定的领域、特定的行业进行深度的集成支持,进行了很多定制化的开发,为这些行业赋能。
打造定制化场景应用

刘炀最后总结道,天算平台将百度的大数据、人工智能全面进行开放,相关行业用户可以使用这些技术简单的搭建起自己的大数据和人工智能平台,同时天算平台针对几个行业推出了定制化的方案,百度希望通过这些行业解决方案,相关的用户可以更容易地搭建自己的智能系统,更快地享受到大数据和人工智能给他们带来的好处。
图片描述
据悉,目前百度天算平台已经为日志分析、数字营销、生命科学、舆情等行业提供了定制的解决方案,并得到了部分客户的实际应用。

-日志分析解决方案
百度日志分析解决方案,基于Lamda架构,同时实现热数据处理与冷数据处理,可以非常方便地搭建一个完整日志分析的系统,百度日志分析系统中集成了百度自研的Palo引擎,支持TB级数据,毫秒级的扫描。

-数字营销解决方案
百度开放云数字营销解决方案依托百度对数字营销服务市场多年的运营经验和技术积累,帮助搜索推广服务商及程序化交易生态中各类客户提升营销效率,实现用户数与收入的双重增长。

-生命科学解决方案
百度开放云生命科学解决方案可以帮助生物信息领域用户存储海量的数据,并调度强大的计算资源来进行基因组、蛋白质组等大数据分析。此外,百度自行研发的基因大数据芯片可以使运算速度得到数倍的提升、IT成本实现数量级的下降,帮助研究生命活动规律,促进医疗健康行业发展。

-舆情解决方案 百度舆情解决方案为舆情服务商提供舆情数据订阅、智能语义分析及受众分析等功能,最终为客户实现个性化深度定制舆情系统,把握时事脉搏。