文科生如何理解卷积神经网络?

不肯意看那一堆公式符号,却想知道卷积神经网络(Convolutional Neural Network)如何作图像分辨?分享一段我给本身研究生的讲解答疑视频,但愿对你有帮助。html

茫然

常有朋友问,个人Python和数据科学课程开在哪一个学期,他们想过来蹭课。编程

很差意思,这个真没有。微信

我写了一系列的数据科学教程。但本来只是给我本身的研究生赋能,并不是课程讲义。网络

他们有的人,本科学的专业,与技术绝不沾边。工具

可是情报学是个交叉学科。尤为是近几年,与数据科学融合愈发深刻。post

往周围看看,其余社会科学专业,例如新闻学、心理学、社会学、政治学等,都在利用开放互联网数据集,作以往没法想象的大规模信息分析。学习

在这种状况下,你一个情报学研究生,处在本来就有数据分析优点的学科,却一点儿也不掌握数据科学技能,出门好意思跟其余同窗打招呼吗?测试

因而我给他们写教程,写尽可能让文科生能看懂的教程。翻译

事实证实,他们能跟着教程,作出来结果。3d

可是,我在《Python编程遇问题,文科生怎么办?》中说过,“照葫芦画葫芦”,只是你入门数据科学的第一步。

你须要理解技术应用的前提和方法,这样才能应对本身的研究问题,利用适当工具,加以解决。

本周的组会上,我听一年级研究生论文翻译展现,明显感受他们对于卷积神经网络结构与原理,依然不清楚。

我很奇怪。

由于我专门为他们写过至少2篇文章,都是讲如何利用卷积神经网络作图像处理的。

并且,他们还用本身的数据集,从新作过训练与测试。

在文章里,我还给他们介绍了深度学习模型的基本原理,而且在文末详细列出了参考资料,供延伸阅读。

这么长时间过去了,怎么仍是懵懵懂懂?

倘在从前,我确定要训人了。

由于怎么看,这都是学习态度不端正的问题。

可是,有了同理心训练基础,我忽然可以理解他们的茫然与苦恼了。

同理

他们看到的延伸阅读材料,像一个黑洞。

这个黑洞吸取他们的时间和工做量,却看不到任何正反馈。

由于他们缺少基础。

要学好深度神经网络,并不须要多么高人一等的智慧。可是一些基础要件却很重要。这些基础包括:

  • 编程
  • 数学
  • 英语

若是有这3个基础,你根本无需导师帮助。自修 Coursera 上 Andrew Ng 《深度学习》这样的精品MOOC课程,就会让你成长迅速,大呼过瘾。

但是对国内的文科生来讲,上面列出的几个基础要件,可谓是“三座大山”,能压得他们步履维艰。

编程没学过,数学早忘了,英语不过关。

你让他们一点一滴从头学起,所有补齐?

即使真补完整了,也该毕业了。

还作什么研究?

诚然,老师能够帮助他们精简学习模块。

编程很差,不要紧。

不要去碰 Tensorflow 的神经网络结构搭建细节语句,只要会用最简单的 TuriCreate 调用迁移学习工具,几行代码搞定图像识别。

英语很差,没事儿。

我把教程给你用中文写出来。你直接照着作,就能出结果。

可是数学很差,理解不了神经网络模型的原理,怎么办?

从前我也是一筹莫展。

要么把整个工具看成黑箱,只知道输入输出,就能作出结果来。

但这是用户的态度,不是研究者的态度。

这种低水准认知,可能让你有机会充分实践什么叫“垃圾进,垃圾出”。

不少对统计学一无所知的学生,不就是这么玩儿SPSS的吗?

想到这里,我忽然灵光一闪。

借鉴

统计学对不少文科生,也很难学。

他们是经过什么途径学会的呢?

是一种“有限度拆解”。

只学会导入数据,点按钮出图表,显然不够用。

可是从头推各类分布的公式,讲解阈值设定(例如那个神奇的0.7)的原理……人早就跑掉了。

怎么办?

我想起来了李连江教授的这本书。

李老师的态度,是原理要讲清楚,不能让学生随便“拷打”数据。

可是又不能深刻到底层数学原理,那样不少文科生根本就看不懂,甚至会很快丧失掉兴趣。

他的办法,简单而实际。

就是举例子和打比方。

用一个SPSS自带的雇员例子,他解释了好几章的内容。从数据的类型,一直到多元回归。

由于有了实际样例,学生充分代入,就好理解。

讲到因子分析,作旋转。这个怎么讲?

他用了两个比喻。

一个是三大男高音,表明3个因子。

三大男高音同台的演唱会,观众如潮。

有的观众爱听多明哥,有的爱听卡雷拉斯,有的是冲着帕瓦罗蒂来的。

可是观众们都坐在一块儿,你分不清哪一个观众到底是哪位歌唱家的粉丝。

怎么办?

让男高音们分开唱,唱对台戏

这是第二个比喻。

一旦有对台戏,观众选择的座位,就明确表明了态度。

某个问项,归属于哪一个因子,也一样能够经过因子唱对台戏(旋转)来分辨。

读了《戏说统计》,我以为讲得真好。

可是我后来看了李老师的课程视频,以为收获更大。

由于视频的信息传播更加丰富。

一样是刚才的例子,由于有了图像化解读,学生能够理解得更加透彻而深入。

尤为是,每当讲到研究中统计结果出来,须要一些“不足为外人道”、“社会科学界有共识”的操做手法,李老师的笑容,总能让人跟着忍俊不由。

讲解

有了李连江老师的例子作参考,我用组会的剩余时间,以板书的形式,一步步为研究生们讲解了如下内容:

  • 深度神经网络的基本结构;
  • 神经元的计算功能实现;
  • 如何对深度神经网络作训练;
  • 如何选择最优的模型(超参数调整);
  • 卷积神经网络基本原理;
  • 迁移学习的实现;
  • 疑问解答。

我没有追求最大化的严谨,也没有对例子的通用性和实用性作更多的要求,只是从头至尾,把一个简化到极致的图像识别模型,与客户流失预判模型进行了对比讲解。

一样的,我用了样例,也用了打比方,尽力把听讲的认知负荷,降到最低。

过程当中,我要求学生随时提问。所以交互很密切。

讲解完毕后,他们几个表示,这下终于弄懂了卷积神经网络的基础知识。

因为最近阎教练的工做坊训练了视觉记录行为,我讲了几分钟后,忽然觉察到这一段能够录下来,分享给更多人。

因而我让坐在前排的杨文同窗,帮我录制了视频。

视频中没有能包含最初的几分钟内容,即刚才列表的前两个部分。颇为遗憾。

不过不要紧,过一段时间后,我准备组会时让研究生上讲台,把这一段复述一遍,做为学习效果检查。

若是他们作得好,我会录下来,分享给你们。

他们还不知道个人打算。

因此你看见后,别告诉他们。嘘!

这段视频时长接近30分钟,不算短。

若是你和他们同样,读过了个人《如何用Python和深度神经网络锁定即将流失的客户?》、《如何用Python和深度神经网络识别图像?》和《如何用Python和深度神经网络寻找近似图片?》这几篇文章,可是对于深度神经网络的原理构造仍是迷茫,建议你从头看到尾,可能会有一些收获。

欢迎点击这个连接,观看视频。

有言在先,由于是即兴讲解,没有任何准备。内容若有疏漏,在所不免。

欢迎各位高手帮助指出纰漏,我会在未来的讲解中,迭代改进。

提早谢过!

讨论

你是如何学会卷积神经网络工做原理的?对于研究中遇到的数学公式,你有没有什么更好的办法理解和掌握呢?欢迎留言,把你的经验和思考分享给你们,咱们一块儿交流讨论。

喜欢请点赞。还能够微信关注和置顶个人公众号“玉树芝兰”(nkwangshuyi)

若是你对数据科学感兴趣,不妨阅读个人系列教程索引贴《如何高效入门数据科学?》,里面还有更多的有趣问题及解法。

相关文章
相关标签/搜索