深度学习 笔记二

项目相关的深度学习html

深度学习:图像识别和天然语言处理。算法

虽然深度学习领域的研究人员相比其余机器学习领域更多的受到了大脑工做原理的启发,并且媒体界也常常强调深度学习算法和大脑工做原理的类似性,但现代深度学习发展并不拘泥模拟人脑神经元和人脑的工做原理。模拟人脑也再也不是深度学习研究的主导方向。不该该认为深度学习是在试图模仿人类的大脑。目前科学家对人类大脑学习机制的理解还不足觉得当下的深度学习模型提供指导。网络

现代的深度学习已经超越了神经科学的观点,它能够更普遍地适用于各类并非由神经网络启发而来的机器学习框架。有一个领域的研究者试图从算法层理解大脑的工做机制,它不一样于深度学习领域,被称为“计算神经学”(computational neuroscience)。深度学习领域主要关注如何创建更准确的模型来模拟人类大脑的工做。框架

项目相关方面:机器学习

1、图像识别函数

图像标注:根据图片生成描述文字(例如标注图片:“两个小孩在玩玩具”),借助“语义概念”检索感兴趣图像,在图像搜索领域有普遍应用,主要实现方法有CNN,RNN等。学习

设想:当用深度学习直接对图片进行聚类效果很差的话,尝试利用图片生成文字,而后再利用机器学习算法或者深度学习进行聚类。编码

图像标注是图到文字,还能够实现文字到图。(感受用不上)spa

一、   知乎用户头像聚类.net

知乎用户状况(60万用户,核心用户为种子爬取):知乎是2010年12月开放,截止至2017年3月,已拥有6900万注册用户,创造了1500万个问题、5500万个回答和25万个话题了。男性过半,IT、互联网、大学生为主,互联网和计算机软件和超50%,加上电子商务和电子游戏几乎是所有了。企业主要是BAT等著名的互联网企业,城市主要是北上广深杭。https://zhuanlan.zhihu.com/p/24411711

知乎头像状况:默认头像和人物头像居多,还有一些卡通人物头像、风景、公司logo等。

数据集能够自动生成,打算利用深度学习分类图片,改进所用算法中某一层的函数,替换成其余高效的函数等。网上对图片进行聚类能够利用自动编码机或者RBM(受限玻尔兹曼机)来作。或者利用网上的一些有标签的数据来作。

RBM: http://blog.csdn.net/mytestmy/article/details/9150213/

图片分类用CAFFE作:有标签https://zhuanlan.zhihu.com/p/24001523

CVPR2016 Paperlist:http://blog.csdn.net/xizero00/article/details/51386667

深度学习资料大全http://www.360doc.com/content/15/1013/23/2459_505464437.shtml#

二、   存在的问题

头像和用户行为之间的联系并无那么直接,经过头像作推荐意义不大。不如直接分析用户相关行为来进行推荐更有针对性。好比QQ进行好友推荐会根据共同好友个数、手机通信录、距离(附近的人)等进行推荐,而不会根据头像来推荐好友(若是根据头像来作,我想和根据摇一摇来找好友差不到哪儿去,认识同一类头像的陌生人?)。除非用户其他信息空白,只有头像,那却是能够用头像来进行推荐,可是这种状况毕竟不多。或许会有奇迹,可是会很艰辛。

可是头像或许能做为一个因素和其余因素一块儿进行学习。大体能提升一点。若是把结点的各类属性综合起来。

既然是根据图片来推荐,那作跟图片关系很大的事物的推荐比较有效吧。好比说给淘宝用户推荐商品,根据用户浏览的商品的图片来推荐类似商品?(可是实际上淘宝商品应该是商品->文字->图片)可是数据集是一个问题。老是在产生各类各样的想法,假设,论证,推翻,否认推翻…..停不下来。实践出真知,先把能作的作了再看。

2、天然语言处理

参照一。

2、总结

深度学习并非黑盒子,只不过能从海量数据中提取通常机器学习所不能提取的复杂特征罢了,不过调参方面的确很靠经验,可是也有相关的文献。