Free and open source mobile deep learning framework, deploying by Baidu.android
This research aims at simply deploying CNN on mobile devices, with low complexity and high speed. It supports calculation on iOS GPU, and is already adopted by Baidu APP.ios
Size: 340k+ (on arm v7)
Speed: 40ms (for iOS Metal GPU Mobilenet) or 30 ms (for Squeezenet)
百度研发的移动端深度学习框架,致力于让卷积神经网络极度简单的部署在手机端。目前正在手机百度内运行。支持iOS gpu计算。体积小,速度快。git
体积 armv7 340k+
速度 iOS GPU mobilenet 能够达到 40ms、squeezenet 能够达到 30msgithub
项目地址:https://github.com/baidu/mobile-deep-learning算法
更多机器学习教程:http://www.tensorflownews.com网络
特征框架
一键部署,脚本参数就能够切换ios或者android
支持iOS gpu运行MobileNet、squeezenet模型
已经测试过能够稳定运行MobileNet、GoogLeNet v一、squeezenet模型
体积极小,无任何第三方依赖。纯手工打造。
提供量化脚本,对32位float转8位uint直接支持,模型体积量化后4M上下
与ARM相关算法团队线上线下屡次沟通,针对ARM平台会持续优化
NEON使用涵盖了卷积、归一化、池化全部方面的操做
汇编优化,针对寄存器汇编操做具体优化
loop unrolling 循环展开,为提高性能减小没必要要的CPU消耗,所有展开判断操做
将大量繁重的计算任务前置到overhead过程机器学习