华为最强自研 NPU 问世,麒麟 810 “抛弃”寒武纪

640?wx_fmt=gif

640?wx_fmt=jpeg

整理 |  一一程序员

出品 | AI科技大本营(ID:rgznai100)算法

责编 | 胡巍巍编程

“能效高、算子多、精度高”,华为消费者业务手机产品线总裁何刚用一句话总结了自研达芬奇架构给最新麒麟810芯片带来的变化。 微信

6 月 21 日,在 HUAWEI Nova 5 系列新品发布会上,最大的亮点之一当属华为发布的麒麟 810 全新人工智能手机芯片,这是首款采用华为自研达芬奇架构的手机 AI 芯片。 网络

去年 10 月,华为推出达芬奇架构的云端 AI 芯片昇腾 Ascend 910 和昇腾 Ascend 310 后,首次将达芬奇架构落地至终端芯片的 NPU,同时这也意味着,他们在 NPU 中抛弃了寒武纪 IP。架构

640?wx_fmt=png

最新的麒麟 810 了采用业界最早进的 7nm 工艺制程,相比 8nm 工艺,能效提高 20%,晶体管密度提高 50%,这让它成为目前全球第三款采用该尖端工艺的手机 SoC 芯片,也是华为继麒麟980 以后推出的第二款 7nm 手机 SoC 芯片。框架

640?wx_fmt=png

近年来,随着端侧AI高速发展,手机厂商对芯片的适配性和灵活性提出更高要求,而华为对此的探索处于一路领跑状态。 工具

2017年,以麒麟 970 为表明的芯片首次采用独立NPU神经网络处理单元,业内也开始探索端侧人工智能应用。2018 年,麒麟 980 采用双核 NPU,进一步提高了端侧 AI 算力,带来 AI 人像留色、卡路里识别等丰富的 AI 应用。 性能

这次,最新麒麟 810 再次领跑业界,首度采用华为自研达芬奇计算架构,再度提高端侧 AI 的性能,而且首次将旗舰级的 AI 性能在中高端手机中落地。学习

640?wx_fmt=png

达芬奇架构是华为在 2018 年推出的全新自研AI计算架构,针对 AI 计算特色进行设计。不一样于以往的二维运算模式,达芬奇架构以高性能 3D Cube 计算引擎为基础,针对矩阵运算进行加速,大幅提升单位面积下的AI算力,激发端侧 AI 的运算潜能。另外,麒麟 810 芯片具备端侧能效业界最优的 AI 运算单元。 

根据 ETH Benchmark 测试,麒麟 810 NPU跑分 32280 分,远超骁龙 710(6556 分)、骁龙730(13908 分)和骁龙 855(25428 分)。

640?wx_fmt=png

对于麒麟 810 搭载华为自研的达芬奇架构,最直接的受害者是寒武纪,由于麒麟 970 第一代的 NPU 用的是寒武纪架构,但实际上,华为要在手机 AI 芯片搭载自研架构早在乎料之中,只是不少人可能没想到落地速度来得如此之快。正如徐直军此前所说,“寒武纪的(IP)也很好,可是它没法支持咱们的全场景,咱们须要从云、到端、到物联网终端的人工智能设备,所以咱们要创造性地打造一款新的架构。而达芬奇架构可以解决极致的功耗与极致的算力需求。” 

按照这个势头,麒麟 810 应该只是开始,咱们有理由相信,不管是 600 系列仍是 900 系列,将来也会很快走向全定制化架构,华为移动计算生态将进一步扩大 

如下从 CPU,GPU,拍照和通讯方面的变化介绍麒麟 810 芯片: 

CPU 方面,麒麟 810 采用全新系统级 AI 调频调度技术,2+6 大小核架构,即搭载两个基于Cortex-A76开发商用的大核,针对移动终端的使用场景进行深度优化,以及六个 Cortex-A55 小核实现能效升级。 

据华为方面介绍,麒麟 810 全新 2+6 能效架构将提供更加精准的调度层次,让 CPU在 游戏、购物等重载场景,以及社交、浏览网页等轻载场景下灵活适配,大大下降 CPU 在实际应用场景中的功耗,实现更持久的续航和更流畅的操做体验。     

640?wx_fmt=png

GPU 则升级到 Mali-G52 定制,支持 Kirin Gaming+ 技术,游戏实力全面升级,经过系统级 AI 调频调度技术、60fps 高性能及 HD 画质和 GPU 负载优化全面升级游戏体验。 

具体而言,AI 调频调度技术可以实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程当中存在的性能瓶颈,及时进行调频调度,预测准确性比传统预测方法提高 30% 以上;GPU 的系列优化技术,可减小重复指令及 GPU 过载,并加快 CPU、GPU 和内存之间的数据传输速度;HD 游戏特效优化能够提高游戏画质、清晰度、明暗对比度等,带给游戏玩家更接近真实世界的游戏体验。 

新一代人工智能有哪些看点?

https://edu.csdn.net/topic/ai30?utm_source=cxrs_bw 

拍照方面,麒麟 810 集成细节加强(DE)模块,支持最新一代自动白平衡算法(AWB)和 AR特征点云计算加速,ISP 性能和算法双提高,这将解决夜景照片出现的噪点和过曝问题,提高画面的细节处理能力和降噪效果。 

通讯方面,麒麟 810 延续旗舰芯片的通讯能力,支持双卡双 VoLTE,让手机的双卡同时保持 4G 在线,将有效防护伪基站的骚扰,有效下降手机信号回落至 2G 网络的风险。 

此外,麒麟 810 推出自研中间算子格式,算子数量多达 240+,支持Tensor,  Vector, Scalar,更多算子、开源框架的支持以及提供更加完备的工具链将助力开发者快速转换集成基于不一样AI框架开发出的模型,大幅加强华为 HiAI 的兼容性,易用性,以加速更多 AI 应用落地。

(*本文为 AI科技大本营整理文章,转载请微信联系 1092722531

640?wx_fmt=png

640?wx_fmt=jpeg

 热 文 推 荐 

全部的 iPhone 和高端 Android 设备都被破解了!

从工地工人转行到程序员,开发价值 500 万的软件!| 程序员有话说

生产环境下 RocketMQ 为何不能开启自动建立主题?

研发管理软件太杂乱?他花了 4 年打造一站式工具!| 人物志

25岁创立加密城堡, 曾经独角兽创始人社会名流天才黑客是这里的沙发客, 现在却无人问津……

真正的博士是如何参加AAAI, ICML, ICLR等AI顶会的?

Python最抢手、Java最流行、Go最有前途,7000位程序员揭秘2019软件开发现状

这位博士跑赢“地震波”:提早 10 秒预警宜宾地震!

17 岁的程序员告诉你关于编程的 7 个重要教训!

☞“是!互联网今后没有 BAT!”