最近又来了不少师弟都在埋头搞图像,但都理不清头绪,迫于导师交待的任务纷纷求教。这里我总结了点经验,或者说育儿手册:机器学习
A、图像识别就像在教小孩辩物,要向他解释目标的主要特征;
(尽可能用他知道的特征,不然还须要解释每一个特征的定义)
例如识别矩形,那么能够告诉他 矩形由4条直线段组成(由于他学过hough变换),相交的线段彼此垂直(斜率互为负倒数)……学习
B、有时感受特征太多则退而求其次,解释目标与视野中其余对象的区别就好;
例如识别车辆,你须要教他什么是车。人工智能
若是场景中只有车辆在动,那么只要告诉他“会动的就是车辆”,这样子只要解释什么是“动”这个特征,或者什么是“不动”也就是“静止”或者“没有变化”(考虑给他借本“帧差法”教材,或者进阶的“光流法”)他就懂了,至少在当前场景下正确……对象
C、另外这个小孩目前数学(客观)学的好,语文(主观)特别差,为了让他学习得更有效率,最好用数学去描述,省得还要先给他补习语文;
仍是车辆识别,若是场景很是单调,只有一色的地面跟车,那么你会说“那就是车”。blog
“那”这个词解释很是麻烦,还须要配合指定方向。你能够换个说法,就是“他看到的物体就是车”,这样你只要解释什么是“物体”,好比物体有“形状”也就是有“轮廓”(边缘检测的话他会不少方法sobel、canny不要太基础)。get
D、他会很是听话,但也很是较真,或者特别敏感;
例如,你以为视野里只有地面跟车,但他能发现不少细小的“物体”,好比地上的小石头、车的阴影。你可让他不敏感(模糊或者说滤波,eg. 均值、中值、高斯,并规定亮度的阈值);再保险一些,你还可能告诉它只有“大”的物体才是车。“大”这个词比较模糊,所幸补习起来不太难——由于“大”是相对的,若是不想再解释什么是“小石头”的话,你最好给他一个已知的参照物,好比他的“视野范围”,最后你跟他说“占了你视野1/3的那个物体就是车”……数学
E、他能够有一些基础,但多数状况是在某个领域\场景下咱们必须从零教起;
所以咱们须要耐心与信任,由于他是个天才;也由于他是个天才,若是他作错了,惟一的可能就是咱们教的不对,幸运的是咱们能够一次次重来。it
F、其实不止是图像识别,机器学习甚至人工智能,咱们均可以把电脑当作一个乖孩子……
你能够经过一些描述/特征去教他,也能够利用训练让他本身摸索——告诉他的越多,他所认识到的越接近真相(但这样咱们每每很难知道他对真相的认知/解释是否真的跟咱们彻底同样,甚至他可能从另外一个角度给出一个当前足够自洽的真相)。class