Tengine-Lite v1.0 版本更新

Tengine-Lite v1.0 版本更新啦!!!重要的事情要打三个感叹号!!!

小O妹和组员肝了不知多少个日日夜夜,这期间被催促,被质疑,小O妹都坚强的挺了过来。上线的那一刻差点哇的哭出来。git

更新内容以下:

新特性:

a. Tengine-Lite开源异构计算切图功能,本版本支持CPU+GPU异构,后续版本敬请期待CPU+NPU (闲来大佬主刀(*❦ω❦),咱们会开个专门的话题来给你们详细讲一讲实现方式)github

b. 新增armv8.2 fp16精度推理,支持fp32/fp16混合精度模式性能优化

c. Tengine-Lite支持Vulkan GPU(适配高通/NV Xavier/x86独立GPU等),终于支持Vulkan了,撒花~网络

example:MobileNet + MobilenetSSD(CPU GPU异构)

d. Tengine-Lite支持Arm Mali GPU(ACL)多线程

example:MobileNet + MobilenetSSD(CPU GPU异构)

e.C++ API(实验性支持)函数

f.Python API(实验性支持)工具

新网络支持:

  • landmark
  • yolact
  • openpose
  • yolov4

新算子支持:

a. 新增UINT8 算子ref,小伙伴们能够结合咱们的全套模型转换工具、量化工具,在x8六、arm平台上验证一下流程啦~虽然速度还不算快,不过这里给你们埋(wa)个(ge)伏笔(keng),UINT8在哪里跑的快呢~性能

  • concat
  • clip
  • convolution
  • detection_out
  • dropout
  • eltwise
  • fc
  • flatten
  • pooling
  • premute
  • priorbox
  • reshape
  • softmax
支持模型UINT8格式模型 MobileNetv一、SqueezeNetv1.一、ResNet1八、ResNet50、GoogleNet、VGG1六、MobileNetv二、Inceptionv三、MobileNetSSD

b. 新增Mish激活函数优化

推理性能:

a. arm多线程推理性能优化(openmp)spa

b. x86性能算子优化

GitHub连接以下,欢迎你们Watch,star,Fork三连支持

https://github.com/OAID/Tengine