Tengine-Lite v1.0 版本更新啦!!!重要的事情要打三个感叹号!!!
小O妹和组员肝了不知多少个日日夜夜,这期间被催促,被质疑,小O妹都坚强的挺了过来。上线的那一刻差点哇的哭出来。git
更新内容以下:
新特性:
a. Tengine-Lite开源异构计算切图功能,本版本支持CPU+GPU异构,后续版本敬请期待CPU+NPU (闲来大佬主刀(*❦ω❦),咱们会开个专门的话题来给你们详细讲一讲实现方式)github
b. 新增armv8.2 fp16精度推理,支持fp32/fp16混合精度模式性能优化
c. Tengine-Lite支持Vulkan GPU(适配高通/NV Xavier/x86独立GPU等),终于支持Vulkan了,撒花~网络
example:MobileNet + MobilenetSSD(CPU GPU异构)
d. Tengine-Lite支持Arm Mali GPU(ACL)多线程
example:MobileNet + MobilenetSSD(CPU GPU异构)
e.C++ API(实验性支持)函数
f.Python API(实验性支持)工具
新网络支持:
- landmark
- yolact
- openpose
- yolov4
新算子支持:
a. 新增UINT8 算子ref,小伙伴们能够结合咱们的全套模型转换工具、量化工具,在x8六、arm平台上验证一下流程啦~虽然速度还不算快,不过这里给你们埋(wa)个(ge)伏笔(keng),UINT8在哪里跑的快呢~性能
- concat
- clip
- convolution
- detection_out
- dropout
- eltwise
- fc
- flatten
- pooling
- premute
- priorbox
- reshape
- softmax
支持模型UINT8格式模型 MobileNetv一、SqueezeNetv1.一、ResNet1八、ResNet50、GoogleNet、VGG1六、MobileNetv二、Inceptionv三、MobileNetSSD
b. 新增Mish激活函数优化
推理性能:
a. arm多线程推理性能优化(openmp)spa
b. x86性能算子优化
GitHub连接以下,欢迎你们Watch,star,Fork三连支持