OpenCV AI Kit (OAK) 创始人Brandon Gilles访谈全记录

本文中,咱们采访了PyImageSearch的忠实读者、OpenCV AI Kit (OAK)创始人——Brandon Gilles,他带来的OAK完全颠覆了人们应用嵌入式计算机视觉和深度学习的方式。编程

为了庆祝OpenCV库成立20周年,Brandon与OpenCV.org官方合做,建立了OpenCV AI Kit——获MIT认证许可的开源软件API以及Myriad X-based嵌入式主板/摄像头。缓存

OAK分为两种:安全

  1. OAK-1: 标准的OpenCV AI板,可以执行神经网络推理、目标跟踪、April Tags识别、特征检测,以及基本的图像处理操做等。
  2. OAK-D: 除包含OAK-1中的全部功能外,还具备立体深度摄像头、3D目标定位、以及3D空间内的目标追踪功能。

在通过Brandon和OpenCV团队的赞成后,提早获取了OpenCV AI Kit的一手资料,让咱们一块儿期待往后PyImageSearch博客上的OAK教程吧。网络

OpenCV AI Kit将完全改变嵌入式计算机视觉和深度学习的执行方式,我已经火烧眉毛地想要上手了。下面让咱们热烈欢迎Brandon Gilles来分享一下他的故事吧。架构

OpenCV AI Kit (OAK) 创始人Brandon Gilles访谈全记录
在这里插入图片描述
Brandon Gilles:OpenCV AI Kit (OAK)的首席架构师。

机器学习

**记者:**能够向你们介绍一下你本身吗?函数

**Brandon:**我是一名电气工程师,是Luxonis的创始人兼首席执行官。一直以来,我都想本身进行创业,而且但愿本身的工做能对世界产生积极的影响。但有点好笑的是,我又老是想要规避风险。因此我花了十多年的时间梦想着能创立本身的公司,却从未真正付诸于行动。因此这是我第一次尝试尽心尽力地去推出一款产品,并白手起家建立属于本身的公司。学习

记者: 你有什么计算机视觉和深度学习方面的经历背景吗?又是如何开始对这个领域感兴趣的呢?测试

Brandon: 和大多数电气工程师同样,我在大学中学习了计算机视觉的课程(如今看来那已是16年前了!),在线性系统等课程中了解了传统的计算机功能。可是起初,个人职业发展轨迹和计算机视觉或深度学习领域没有任何的交集,但当个人导师从咱们共同就任的公司离职时,一切都变了。优化

我很喜欢当时的工做,他也很喜欢(他当时是公司的天线设计师),因此他的离职就更让人以为匪夷所思。

我曾问过他为何要离职,他告诉我说:“AI和深度学习将会颠覆全部的行业,这或许是我职业生涯中最大的机会——我必需要搏一次!”

那时候我还不太了解深度学习,上一次提到“人工智能”这个词仍是2004年的时候。当时个人大学室友在Lisp中尝试了人工智能技术,但结果却很不理想。因此从2004年到2016年年中,我一直觉得人工智能模型是“毫无用处”的。

后来,当这位我十分尊敬的导师离开了咱们都很喜欢的工做,并全身心地投入到人工智能/机器学习/深度学习工做中时,我感到无比震惊,这才睁开眼睛从新审视这个领域。

那天我回到家,在谷歌上搜索了“深度学习”、“机器学习”、“人工智能”等关键词。而后在接下来的一年里,我都沉迷其中,把全部的空闲时间(甚至连上厕所的时间都不放过)都花在了PyImageSearch上,学习网站上的教程,并密切关注TowardsDataScience、MIT Technology上的评论。

图片: https://uploader.shimo.im/f/qP6h3OrdIIvbA9EQ.png
OpenCV AI Kit (OAK)。OAK-D具有立体深度(左图)功能,而便宜一点的OAK-1(右图)相对体积较小,但没有深度功能

记者: 咱们来聊聊这次OpenCV AI Kit 在Kickstarter上的活动吧。我记得你第一次跟我提到这个项目是在2018年,不过当时它还叫“DepthAI”。你是经过什么样的契机提出的DepthAI呢?又是如何对其进行验证,并最终成长为OpenCV AI Kit的呢?

Brandon: 过程确实有点曲折,它中途换过好几回名字(我对此也感到很抱歉)。当时我身边的朋友和家人遇到了一些情况,致使我想作一些事情以提供力所能及的帮助。

当时我本来想运用新技术作一款激光枪战游戏(对玩家、墙壁、建筑物等进行强化)。因此在2017年,我从原公司离职,开启了本身的全职CV/ML工做生涯,想要经过技术突破来设计出一款可以适配现有激光枪战设备的多玩家 AR系统。

但就在那个时候,先后大约一周的时间里,我家人和朋友的身边(他们的朋友、亲戚、或同事)发生了不少起交通意外。虽然事故并无发生在我最亲近的人身上,但这些故事仍是对我产生的巨大的影响。

我父亲最好的朋友被车从后面撞倒,致使背部、股骨和臀部多处骨折,伤情十分严重,在床上躺了9个月消肿后才进行了手术;同时,我好朋友的生意伙伴也遇到了相似的经历;而我大学时一块儿滑雪的伙伴也遭遇了一样的意外,甚至还受了脑外伤;我所在的黑客空间创始人的合做伙伴也死于交通事故(被汽车的后视镜击中了脖子,当场死亡)。

因此忽然间,我感受本身设计的这个加强现实激光系统彷佛不太合时宜。鉴于我已经花了数年时间研究计算机视觉、机器学习、深度学习以及其余新兴技术,因此我开始思考如何能构建一个预防此类事故的嵌入式系统。

若是在事故发生前汽车能靠左行驶12英寸的话,就能够避免悲剧的发生了。几年前我曾见识过Jonathan Lansey的LOUD Bicycle 在Kickstarter上众筹的效果,那正是我想要的!我要设计一个可以为骑行者和汽车司机提供警示的系统,从而防止交通悲剧的发生。

在我看来,若是计算机视觉和深度学习可以在分析CT扫描图像方面赛过医生;在图像分类、目标检测、3D感知等方面赛过人脑,那么也必定有方法能创造出保障人们生命安全的设备。

在个人构想中,这款设备就至关因而骑行在你身后的朋友,当后面有汽车可能会撞向你时,他就会闪起LED强光;当车辆真的要撞上来的时候,他会提早开始鸣笛(但实际音量很是小),留出避让的时间。此后,我利用从PyImageSearch上学到的知识,以及从Github上获取的Katsuya Hyodo (PINTO0309)制做出了第一款可以实现上述目标的原型:

图片: https://uploader.shimo.im/f/4YHXezwmBf0eI4ra.png
Brandon对往后OpenCV AI Kit的最初灵感

虽然这个原型体积巨大,也不够美观,但它却能达到最初的设计目的!我在原型设计和测试的过程当中学到了一件很是重要的事情:

深度+适度对象检测能简化问题的解决过程,而且在减小代码/工做量的基础上顺利运行。

如今,当初的构想已经实现了,可以经过各类反馈来为骑车的人们提供警示,如闪烁的led灯,甚至还有超级大声的喇叭。这教会了我第二件重要的事:

尽管有单独的组件(深度摄像头、AI处理器、嵌入式CPU等),但仍没法将其构建成小型的嵌入式产品(因为体积太大、过于笨重,因此没办法将其放置在自行车座椅下,并且成本也较高)。

但巧的是,当时Myriad X刚开始发售,它具有的CV/AI功能恰好能够解决上述问题,但必需要有U盘或PCIE卡,但是两者都没法嵌入使用,也都不适用深度引擎以及其余CV加速功能(运动估计、边缘检测、目标跟踪、特征跟踪、视频编码、等等)。因此U盘/PCIE没法应用于嵌入式或神经推理之外的应用程序。

在面对这个问题的时候,我和我背后的团队要么就选择完全放弃,要么就主动去建造一个新平台。咱们选择去构建新平台——当时将其称为DepthAI。在进行过一段时间的初步销售后(你当时也发布了有关咱们平台的推特),OpenCV 的Mallick博士找到咱们,想要接管这个平台,并将其做为解决此类嵌入式CV&AI问题的OpenCV的核心部分。

**记者:**咱们来聊一下OpenCV AI Kit背后的硬件吧。是什么推进了这款嵌入式设备的制做呢?做为深刻学习/计算机视觉从业者,咱们又为何要了解OpenCV AI 呢?

Brandon: 咱们选择Myriad X的缘由是,它在低能耗的芯片中知足了咱们所需的一切功能。
1. 实时神经推理(几乎涵盖了全部的网络)
2. 立体深度
3. 特征跟踪,包括运动估计和平台运动估计
4. 对象跟踪
5. H.265/H.264编码(用于记录事件,或单纯的进行记录)
6. JPEG 编码
7. 16x高效矢量处理器,用于将全部功能组合在一块儿并运行加速CV函数(能够将其视为连接嵌入式特定视觉GPU)。






做为一名电气工程师,我说:“那太好了,我只要有芯片和SDK就够了!”我发现,该芯片惟一的SDK是用于神经推理的……市场上的其余产品(计算棒、PCIE卡等)都没法使用其余功能,只能进行推理。

全部这些功能结合在一块儿,最终使其成为了咱们的不二之选。在U盘或PCIE中的应用其实只发挥了它1/7的功能(若是加上其余被我忘记的功能的话,也就只发挥了1/10的样子)。

至此,咱们有了芯片,而且得到了所需的功能。简而言之,咱们发掘了Myriad X的真正潜力——它将全部功能结合在一块儿,能够解决Spatial AI的问题。

Spatial AI是借助人工智能来得到物理坐标的功能——肯定目标的位置(以米为单位)。这正是咱们要进行实时监控和跟踪车辆3D轨迹时所须要的功能。

记者: 这样看来,OpenCV AI Kit不只仅是一个嵌入式人工智能板。它仍是一个API,对吗?那用户是如何与API进行交互的呢?它与Python和OpenCV兼容吗?

Brandon: 问得好。人们关于这个平台的最大困惑是“它不过就是另外一个主板而已”。虽然硬件很重要(由于它能为Myriad X提供所需的支持),但更关键的是API,以及咱们配置Myriad X硬件块的新方式:以简单的方式提供全部功能。咱们花了大量的时间来优化缓存、芯片内部通讯系统和DDR通讯,进行了大量的重写,最终让Myriad X可以实现上述功能。

咱们经过一个简单的API公开了这一消息:兼容Python和OpenCV。它其实是借助pybind11用C++编写而成的(也是开源的,所以可以在能够编译OpenCV的任何平台上进行编译),提供了Python中的API功能。简而言之,C++接口和直接编程也能够完成。

Kickstarter侧重于OAK的USB接口版,但咱们正在作SPI接口版的后台……这样一来,就能够链接到其余系统,例如没有操做系统的微控制器。该项目可能会在Kickstarter活动结束时实现开源。

记者: 你在嵌入式系统、主板设计和制造方面有着丰富的经验,那在制造OpenCV AI Kit的过程当中,遇到的最大难题是什么?又是如何解决的呢?

Brandon:最具挑战性的实际上是零部件采购,特别是摄像头的采购。过去的几十年里,咱们见证了各个领域的信息透明化趋势以及组件购买便捷性趋势,但这波浪潮尚未进入摄像头模块市场,该市场仍然很是不透明且固化。在我看来,市场已经濒临瓦解。

在这种状况下,咱们须要花费大量的时间与供应商进行沟通、下订单、进行协商谈判。除此之外,制造过程和供应链一直都运行顺利。在Kickstarter众筹以前,咱们在试运行中得到了99.7%的收益率,这一结果仍是很振奋人心的。

图片: https://uploader.shimo.im/f/eE3IIOjnPKT2yBD6.png
图4:若是你想学习如何在本身的数据集上训练深度学习模型,能够看一看《Deep Learning for Computer Vision with Python》

记者:你做为PyImageSearch的忠实读者和用户,也读过《Raspberry Pi for Computer Vision》和《Deep Learning for Computer Vision with Python》两本书。那么你是如何使用这些书来帮助本身开发OpenCV AI Kit的呢?

Brandon:其实咱们团队会一块儿团购大家的每一本书(其中大部分都是在咱们合做以前就买了的)。

PyImageSearch能帮助咱们缩短构建原型所需的时间。有了大家的教程和书,咱们只须要20秒就能够解决本来可能要花10个小时才能搞清楚的问题。由于书中对各种代码库和机器学习技术的运行方法都进行了详细说明。

因此,PyImageSearch能帮助咱们快速构建原型,了解借助计算机视觉解决此类问题的可行性。正因如此,咱们才发现:并不是全部人均可以使用Myriad X的功能。PyImageSearch帮助咱们了解自身的任务,并协助任务的顺利运行,避免没必要要的麻烦。

**记者:**你会向其余想要学习计算机视觉和深度学习的开发人员、学生、研究员推荐《Raspberry Pi for Computer Vision》和《Deep Learning for Computer Vision with Python》吗?

**Brandon:**固然会!我以前彻底不了解本身的想法在技术层面是否可行,但PyImageSearch向我展现了其可行性,并协助我实现系统的顺利运行。

若是你对这个行业感兴趣的话,这两本书必定能够帮助你加深了解,并掌握解决实际问题的方法。

**记者:**对于那些想追随你的脚步,学习计算机视觉和深度学习,而后在CV/DL领域推出产品的人,你有什么建议吗?

Brandon:你们能够从PyImageSearch教程入手。我曾花大量的时间来阅读理论知识和最新技术进展信息,但后来我才发现,只有当我开始真正着手运行PyImageSearch代码,并经过修改代码来解决实际问题时,一切才真正开始。

**记者:**若是有PyImageSearch的读者想和你聊一聊的话,有没有什么能够联系你的方式呢?

**Brandon:**我一直坚信工程师是一个须要与他人进行直接交流的职业,所以咱们开通了几种交流途径:首先,能够在咱们的社区频道(https://luxonis-community.slack.com/)找到我。只要我醒着,就常常会出如今那里。此外,还能够经过咱们的网络论坛(https://discuss.luxonis.com/)与我进行交流。你们也能够随时给我发邮件,邮箱地址是:brandon@luxonis.com。
总结

以上即是咱们对身为企业家、PyImageSearch 读者及用户、OpenCV AI Kit 建立者的Brandon Gilles的采访全记录。

本文转载自:https://www.pyimagesearch.com/2020/07/20/an-interview-with-brandon-gilles-creator-of-the-opencv-ai-kit-oak/ 做者:Adrian Rosebrock

相关文章
相关标签/搜索