编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各类文档,视频,源码等。并且原文也会不按期的更新,望看到文章的朋友可以学到更多。html
《Brief History of Machine Learning》python
介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost 到随机森林、Deep Learning.git
《Deep Learning in Neural Networks: An Overview》程序员
介绍:这是瑞士人工智能实验室 Jurgen Schmidhuber 写的最新版本《神经网络与深度学习综述》本综述的特色是以时间排序,从 1940 年开始讲起,到 60-80 年代,80-90 年代,一直讲到 2000 年后及最近几年的进展。涵盖了 deep learning 里各类 tricks,引用很是全面.github
《A Gentle Introduction to Scikit-Learn: A Python Machine Learning Library》面试
介绍:这是一份 python 机器学习库,若是您是一位 python 工程师并且想深刻的学习机器学习.那么这篇文章或许可以帮助到你.正则表达式
《How to Layout and Manage Your Machine Learning Project》算法
介绍:这一篇介绍若是设计和管理属于你本身的机器学习项目的文章,里面提供了管理模版、数据管理与实践方法.shell
《Machine Learning is Fun!》编程
介绍:若是你还不知道什么是机器学习,或则是刚刚学习感受到很枯燥乏味。那么推荐一读。这篇文章已经被翻译成中文,若是有兴趣能够移步 http://blog.jobbole.com/67616/
《R语言参考卡片》
介绍:R语言是机器学习的主要语言,有不少的朋友想学习R语言,可是老是忘记一些函数与关键字的含义。那么这篇文章或许可以帮助到你
《Choosing a Machine Learning Classifier》
介绍:我该如何选择机器学习算法,这篇文章比较直观的比较了 Naive Bayes,Logistic Regression,SVM,决策树等方法的优劣,另外讨论了样本大小、Feature 与 Model 权衡等问题。此外还有已经翻译了的版本:http://www.52ml.net/15063.html
《An Introduction to Deep Learning: From Perceptrons to Deep Networks》
介绍:深度学习概述:从感知机到深度网络,做者对于例子的选择、理论的介绍都很到位,由浅入深。翻译版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html
《The LION Way: Machine Learning plus Intelligent Optimization》
介绍:<机器学习与优化>这是一本机器学习的小册子, 短短 300 多页道尽机器学习的方方面面. 图文并茂, 生动易懂, 没有一坨坨公式的烦恼. 适合新手入门打基础, 也适合老手温故而知新. 比起 MLAPP/PRML 等大部头, 也许这本你更须要!具体内容推荐阅读:http://intelligent-optimization.org/LIONbook/
《深度学习与统计学习理论》
介绍:做者是来自百度,不过他本人已经在 2014 年 4 月份申请离职了。可是这篇文章很不错若是你不知道深度学习与支持向量机/统计学习理论有什么联系?那么应该当即看看这篇文章.
《计算机科学中的数学》
介绍:这本书是由谷歌公司和 MIT 共同出品的计算机科学中的数学:Mathematics for Computer Science,Eric Lehman et al 2013 。分为 5 大部分:1)证实,概括。2)结构,数论,图。3)计数,求和,生成函数。4)几率,随机行走。5)递归。等等
《信息时代的计算机科学理论(Foundations of Data Science)》
介绍:信息时代的计算机科学理论,目前国内有纸质书购买,iTunes 购买
《Data Science with R》
介绍:这是一本由雪城大学新编的第二版《数据科学入门》教材:偏实用型,浅显易懂,适合想学习R语言的同窗选读。
《Twenty Questions for Donald Knuth》
介绍:这并非一篇文档或书籍。这是篇向图灵奖得主 Donald Knuth 提问记录稿: 近日, Charles Leiserson, Al Aho, Jon Bentley 等大神向 Knuth 提出了 20 个问题,内容包括 TAOCP,P/NP 问题,图灵机,逻辑,以及为何大神不用电邮等等。
《Automatic Construction and Natural-Language Description of Nonparametric Regression Models》
介绍:不会统计怎么办?不知道如何选择合适的统计模型怎么办?那这篇文章你的好好读一读了麻省理工 Joshua B. Tenenbaum 和剑桥 Zoubin Ghahramani 合做,写了一篇关于 automatic statistician 的文章。能够自动选择回归模型类别,还能自动写报告...
《ICLR 2014 论文集》
介绍:对深度学习和 representation learning 最新进展有兴趣的同窗能够了解一下
《Introduction to Information Retrieval》
介绍:这是一本信息检索相关的书籍,是由斯坦福 Manning 与谷歌副总裁 Raghavan 等合著的 Introduction to Information Retrieval 一直是北美最受欢迎的信息检索教材之一。最近做者增长了该课程的幻灯片和做业。IR 相关资源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html
《Machine learning in 10 pictures》
介绍:Deniz Yuret 用 10 张漂亮的图来解释机器学习重要概念:1. Bias/Variance Tradeoff 2. Overfitting 3. Bayesian / Occam's razor 4. Feature combination 5. Irrelevant feature 6. Basis function 7. Discriminative / Generative 8. Loss function 9. Least squares 10. Sparsity. 很清晰
《雅虎研究院的数据集汇总》
介绍:雅虎研究院的数据集汇总: 包括语言类数据,图与社交类数据,评分与分类数据,计算广告学数据,图像数据,竞赛数据,以及系统类的数据。
《An Introduction to Statistical Learning with Applications in R》
介绍:这是一本斯坦福统计学著名教授 Trevor Hastie 和 Robert Tibshirani 的新书,而且在 2014 年一月已经开课:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about
Best Machine Learning Resources for Getting Started
介绍:机器学习最佳入门学习资料汇老是专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门。并且这篇文章的介绍已经被翻译成中文版。若是你不怎么熟悉,那么我建议你先看一看中文的介绍。
My deep learning reading list
介绍:主要是顺着 Bengio 的 PAMI review 的文章找出来的。包括几本综述文章,将近 100 篇论文,各位山头们的 Presentation。所有均可以在 google 上找到。
Cross-Language Information Retrieval
介绍:这是一本书籍,主要介绍的是跨语言信息检索方面的知识。理论不少
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
介绍:本文共有三个系列,做者是来自 IBM 的工程师。它主要介绍了推荐引擎相关算法,并帮助读者高效的实现这些算法。探索推荐引擎内部的秘密,第 2 部分: 深度推荐引擎相关算法 - 协同过滤,探索推荐引擎内部的秘密,第 3 部分: 深度推荐引擎相关算法 - 聚类
《Advice for students of machine learning》
介绍:康奈尔大学信息科学系助理教授 David Mimno 写的《对机器学习初学者的一点建议》, 写的挺实际,强调实践与理论结合,最后还引用了冯 · 诺依曼的名言: "Young man, in mathematics you don't understand things. You just get used to them."
分布式并行处理的数据
介绍:这是一本关于分布式并行处理的数据《Explorations in Parallel Distributed Processing: A Handbook of Models, Programs, and Exercises》,做者是斯坦福的 James L. McClelland。着重介绍了各类神级网络算法的分布式实现,作 Distributed Deep Learning 的童鞋能够参考下
《“机器学习”是什么?》
介绍:【“机器学习”是什么?】John Platt 是微软研究院杰出科学家,17 年来他一直在机器学习领域耕耘。近年来机器学习变得煊赫一时,Platt 和同事们遂决定开设博客,向公众介绍机器学习的研究进展。机器学习是什么,被应用在哪里?来看 Platt 的这篇博文
《2014 年国际机器学习大会 ICML 2014 论文》
介绍:2014 年国际机器学习大会(ICML)已经于 6 月 21-26 日在国家会议中心隆重举办。本次大会由微软亚洲研究院和清华大学联手主办,是这个有着 30 多年历史并享誉世界的机器学习领域的盛会首次来到中国,已成功吸引海内外 1200 多位学者的报名参与。干货不少,值得深刻学习下
《Machine Learning for Industry: A Case Study》
介绍:这篇文章主要是以 Learning to Rank 为例说明企业界机器学习的具体应用,RankNet 对 NDCG 之类不敏感,加入 NDCG 因素后变成了 LambdaRank,一样的思想从神经网络改成应用到 Boosted Tree 模型就成就了 LambdaMART。Chirs Burges,微软的机器学习大神,Yahoo 2010 Learning to Rank Challenge 第一名得主,排序模型方面有 RankNet,LambdaRank,LambdaMART,尤为以 LambdaMART 最为突出,表明论文为: From RankNet to LambdaRank to LambdaMART: An Overview 此外,Burges 还有不少有名的表明做,好比:A Tutorial on Support Vector Machines for Pattern Recognition
Some Notes on Applied Mathematics for Machine Learning
100 Best GitHub: Deep Learning
介绍:100 Best GitHub: Deep Learning
《UFLDL-斯坦福大学 Andrew Ng 教授“Deep Learning”教程》
介绍:本教程将阐述无监督特征学习和深度学习的主要观点。经过学习,你也将实现多个功能学习/深度学习算法,能看到它们为你工做,并学习如何应用/适应这些想法到新问题上。本教程假定机器学习的基本知识(特别是熟悉的监督学习,逻辑回归,梯度降低的想法),若是你不熟悉这些想法,咱们建议你去这里机器学习课程,并先完成第 II,III,IV 章(到逻辑回归)。此外这关于这套教程的源代码在 github 上面已经有 python 版本了 UFLDL Tutorial Code
*《Deep Learning for Natural Language Processing and Related Applications》
介绍:这份文档来自微软研究院,精髓不少。若是须要彻底理解,须要必定的机器学习基础。不过有些地方会让人眼前一亮,毛塞顿开。
Understanding Convolutions
介绍:这是一篇介绍图像卷积运算的文章,讲的已经算比较详细的了
《Machine Learning Summer School》
介绍:天天请一个大牛来说座,主要涉及机器学习,大数据分析,并行计算以及人脑研究。https://www.youtube.com/user/smolix (需FQ)
《Awesome Machine Learning》
介绍:一个超级完整的机器学习开源库总结,若是你认为这个碉堡了,那后面这个列表会更让你惊讶:【Awesome Awesomeness】,国内已经有热心的朋友进行了翻译中文介绍,机器学习数据挖掘免费电子书
斯坦福《天然语言处理》课程视频
介绍:ACL 候任主席、斯坦福大学计算机系 Chris Manning 教授的《天然语言处理》课程全部视频已经能够在斯坦福公开课网站上观看了(如 Chrome 不行,可用 IE 观看) 做业与测验也能够下载。
《Deep Learning and Shallow Learning》
介绍:对比 Deep Learning 和 Shallow Learning 的好文,来着浙大毕业、MIT 读博的 Chiyuan Zhang 的博客。
《Recommending music on Spotify with deep learning》
介绍:利用卷积神经网络作音乐推荐。
《Neural Networks and Deep Learning》
介绍:神经网络的免费在线书,已经写了三章了,还有对应的开源代码:https://github.com/mnielsen/neural-networks-and-deep-learning 爱好者的福音。
《Java Machine Learning》
介绍:Java 机器学习相关平台和开源的机器学习库,按照大数据、NLP、计算机视觉和 Deep Learning 分类进行了整理。看起来挺全的,Java 爱好者值得收藏。
《Machine Learning Theory: An Introductory Primer》
介绍:机器学习最基本的入门文章,适合零基础者
《机器学习常见算法分类汇总》
介绍:机器学习的算法不少。不少时候困惑人们都是,不少算法是一类算法,而有些算法又是从其余算法中延伸出来的。这里,咱们从两个方面来给你们介绍,第一个方面是学习的方式,第二个方面是算法的相似性。
《机器学习经典论文/survey 合集》
介绍:看题目你已经知道了是什么内容,没错。里面有不少经典的机器学习论文值得仔细与反复的阅读。
《机器学习视频库》
介绍:视频由加州理工学院(Caltech)出品。须要英语底子。
《机器学习经典书籍》
介绍:总结了机器学习的经典书籍,包括数学基础和算法理论的书籍,可作为入门参考书单。
《16 Free eBooks On Machine Learning》
介绍:16 本机器学习的电子书,能够下载下来在 pad,手机上面任意时刻去阅读。很少我建议你看完一本再下载一本。
《A Large set of Machine Learning Resources for Beginners to Mavens》
介绍:标题很大,重新手到专家。不过看完上面全部资料。确定是专家了
《机器学习最佳入门学习资料汇总》
介绍:入门的书真的不少,并且我已经帮你找齐了。
《Sibyl》
介绍:Sibyl 是一个监督式机器学习系统,用来解决预测方面的问题,好比 YouTube 的视频推荐。
《Deep Learning》
介绍:Yoshua Bengio, Ian Goodfellow, Aaron Courville 著
《Neural Network & Text Mining》
介绍:关于(Deep) Neural Networks 在 NLP 和 Text Mining 方面一些 paper 的总结
《前景目标检测1(总结)》
介绍:计算机视觉入门以前景目标检测1(总结)
《行人检测》
介绍:计算机视觉入门之行人检测
《Deep Learning – important resources for learning and understanding》
介绍:Important resources for learning and understanding . Is awesome
《Machine Learning Theory: An Introductory Primer》
介绍:这又是一篇机器学习初学者的入门文章。值得一读
《Neural Networks and Deep Learning》
介绍:在线 Neural Networks and Deep Learning 电子书
《Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱》
介绍:python 的 17 个关于机器学习的工具
《神奇的伽玛函数(上)》
介绍:下集在这里神奇的伽玛函数(下)
《分布式机器学习的故事》
介绍:做者王益目前是腾讯广告算法总监,王益博士毕业后在 google 任研究。这篇文章王益博士 7 年来从谷歌到腾讯对于分布机器学习的所见所闻。值得细读
《机器学习提高之道(Level-Up Your Machine Learning)》
介绍:把机器学习提高的级别分为0~4 级,每级须要学习的教材和掌握的知识。这样,给机器学习者提供一个上进的路线图,以避免走弯路。另外,整个网站都是关于机器学习的,资源很丰富。
《Machine Learning Surveys》
介绍:机器学习各个方向综述的网站
《Deep Learning Reading list》
介绍:深度学习阅资源列表
《Deep Learning: Methods and Applications》
介绍:这是一原本自微的研究员 li Peng 和 Dong Yu 所著的关于深度学习的方法和应用的电子书
《Machine Learning Summer School 2014》
介绍:2014 年七月 CMU 举办的机器学习夏季课刚刚结束有近 50 小时的视频、十多个 PDF 版幻灯片,覆盖深度学习,贝叶斯,分布式机器学习,伸缩性等热点话题。全部 13 名讲师都是牛人:包括大牛 Tom Mitchell (他的[机器学习]是名校的经常使用教材),还有 CMU 李沐 .(1080P 高清哟)
《Sibyl: 来自 Google 的大规模机器学习系统》
介绍:在今年的 IEEE/IFIP 可靠系统和网络(DSN)国际会议上,Google 软件工程师 Tushar Chandra 作了一个关于 Sibyl 系统的主题演讲。 Sibyl 是一个监督式机器学习系统,用来解决预测方面的问题,好比 YouTube 的视频推荐。详情请阅读 google sibyl
《Building a deeper understanding of images》
介绍:谷歌研究院的 Christian Szegedy 在谷歌研究院的博客上简要地介绍了他们今年参加 ImageNet 取得好成绩的 GoogLeNet 系统.是关于图像处理的。
《Bayesian network 与 python 几率编程实战入门》
介绍:贝叶斯学习。若是不是很清可看看几率编程语言与贝叶斯方法实践
《AMA: Michael I Jordan》
介绍:网友问伯克利机器学习大牛、美国双料院士 Michael I. Jordan:"若是你有 10 亿美金,你怎么花?Jordan: "我会用这 10 亿美金建造一个 NASA 级别的天然语言处理研究项目。"
《机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)》
介绍:常见面试之机器学习算法思想简单梳理
《文本与数据挖掘视频汇总》
介绍:Videolectures 上最受欢迎的 25 个文本与数据挖掘视频汇总
《怎么选择深度学习的 GPUs》
介绍:在 Kaggle 上常常取得不错成绩的 Tim Dettmers 介绍了他本身是怎么选择深度学习的 GPUs, 以及我的如何构建深度学习的 GPU 集群: http://t.cn/RhpuD1G
《对话机器学习大神 Michael Jordan:深度模型》
介绍:对话机器学习大神 Michael Jordan
《Deep Learning 和 Knowledge Graph 引爆大数据革命》
介绍:还有2,3 部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html
《Deep Learning 教程翻译》
介绍:是 Stanford 教授 Andrew Ng 的 Deep Learning 教程,国内的机器学习爱好者很热心的把这个教程翻译成了中文。若是你英语很差,能够看看这个
《Deep Learning 101》
介绍:由于近两年来,深度学习在媒体界被炒做很厉害(就像大数据)。其实不少人都还不知道什么是深度学习。这篇文章由浅入深。告诉你深度学到底是什么!
《UFLDL Tutorial》
介绍:这是斯坦福大学作的一免费课程(很勉强),这个能够给你在深度学习的路上给你一个学习的思路。里面提到了一些基本的算法。并且告诉你如何去应用到实际环境中。中文版
《Toronto Deep Learning Demos》
介绍:这是多伦多大学作的一个深度学习用来识别图片标签/图转文字的 demo。是一个实际应用案例。有源码
《Deep learning from the bottom up》
介绍:机器学习模型,阅读这个内容须要有必定的基础。
《R工具包的分类汇总》
介绍: (CRAN Task Views, 34 种常见任务,每一个任务又各自分类列举若干经常使用相关工具包) 例如: 机器学习,天然语言处理,时间序列分析,空间信息分析,多重变量分析,计量经济学,心理统计学,社会学统计,化学计量学,环境科学,药物代谢动力学等
《机器学习常见算法分类汇总》
介绍: 机器学习无疑是当前数据分析领域的一个热点内容。不少人在平时的工做中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工做和学习中参考.
《Deep Learning(深度学习)学习笔记整理系列》
介绍: 不少干货,并且做者还总结了好几个系列。另外还做者还了一个文章导航.很是的感谢做者总结。
Deep Learning(深度学习)学习笔记整理系列之(二)
Deep Learning(深度学习)学习笔记整理系列之(三)
Deep Learning(深度学习)学习笔记整理系列之(四)
Deep Learning(深度学习)学习笔记整理系列之(五)
Deep Learning(深度学习)学习笔记整理系列之(六)
Deep Learning(深度学习)学习笔记整理系列之(七)
DeepLearning(深度学习)学习笔记整理系列之(八)
《Tutorials Session A - Deep Learning for Computer Vision》
介绍:传送理由:Rob Fergus 的用深度学习作计算机是觉的 NIPS 2013 教程。有 mp4, mp3, pdf 各类下载 他是纽约大学教授,目前也在 Facebook 工做,他 2014 年的 8 篇论文
《FudanNLP》
介绍:FudanNLP,这是一个复旦大学计算机学院开发的开源中文天然语言处理(NLP)工具包 Fudan NLP 里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能,对搜索引擎文本分析等极为有价值。
《Open Sourcing ml-ease》
介绍:LinkedIn 开源的机器学习工具包,支持单机, Hadoop cluster,和 Spark cluster 重点是 logistic regression 算法
《机器学习周刊》
介绍:对于英语很差,但又很想学习机器学习的朋友。是一个大的福利。机器学习周刊目前主要提供中文版,仍是面向广大国内爱好者,内容涉及机器学习、数据挖掘、并行系统、图像识别、人工智能、机器人等等。谢谢做者
《线性代数》
介绍:《线性代数》是《机器学习》的重要数学先导课程。其实《线代》这门课讲得浅显易懂特别不容易,若是一上来就讲逆序数及罗列行列式性质,很容易让学生失去学习的兴趣。我我的推荐的最佳《线性代数》课程是麻省理工 Gilbert Strang 教授的课程。 课程主页
《Big-data》
介绍:大数据数据处理资源、工具不完备列表,从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等。很赞的资源汇总。
《machine learning for smart dummies》
介绍:雅虎邀请了一名来自本古里安大学的访问学者,制做了一套关于机器学习的系列视频课程。本课程共分为 7 期,详细讲解了有关 SVM, boosting, nearest neighbors, decision trees 等常规机器学习算法的理论基础知识。
《Entanglement-Based Quantum Machine Learning》
介绍:应对大数据时代,量子机器学习的第一个实验 paper 下载
《How a Math Genius Hacked OkCupid to Find True Love》
介绍:Wired 杂志报道了 UCLA 数学博士 Chris McKinlay (图1)经过大数据手段+机器学习方法破解婚恋网站配对算法找到真爱的故事,经过 Python 脚本控制着 12 个帐号,下载了婚恋网站 2 万女用户的 600 万问题答案,对他们进行了统计抽样及聚类分析(图2,3),最后终于收获了真爱。科技改变命运!
《Underactuated Robotics》
介绍:MIT 的 Underactuated Robotics 于 2014 年 10 月 1 日开课,该课属于 MIT 研究生级别的课程,对机器人和非线性动力系统感兴趣的朋友不妨能够挑战一下这门课程!
《mllib 实践经验(1)》
介绍:mllib 实践经验分享
《Google Turns To Deep Learning Classification To Fight Web Spam》
介绍:Google 用 Deep Learning 作的 antispam (反垃圾邮件)
《NLP 经常使用信息资源》
介绍:NLP 经常使用信息资源* 《NLP 经常使用信息资源》
《机器学习速查表》
介绍:机器学习速查表
《Best Papers vs. Top Cited Papers in Computer Science》
介绍:从 1996 年开始在计算机科学的论文中被引用次数最多的论文
《InfiniTAM: 基于深度图像的体数据集成框架》
介绍:把今年的一个 ACM Trans. on Graphics (TOG)论文中的代码整理为一个开源的算法框架,共享出来了。欢迎你们使用。能够实时的采集 3D 数据、重建出三维模型。Online learning,GPU Random forest,GPU CRF 也会后续公开。
《Hacker's guide to Neural Networks》
介绍:【神经网络黑客指南】如今,最火莫过于深度学习(Deep Learning),怎样更好学习它?可让你在浏览器中,跑起深度学习效果的超酷开源项目 convnetjs 做者 karpathy 告诉你,最佳技巧是,当你开始写代码,一切将变得清晰。他刚发布了一本图书,不断在线更新
《Building a Production Machine Learning Infrastructure》
介绍:前 Google 广告系统工程师 Josh Wills 讲述工业界和学术界机器学习的异同,大实话
《Deep Learning Sentiment Analysis for Movie Reviews using Neo4j》
介绍:使用 Neo4j 作电影评论的情感分析。
《DeepLearning.University – An Annotated Deep Learning Bibliography》
介绍:不只是资料,并且还对有些资料作了注释。
《A primer on deeping learning》
介绍:深度学习入门的初级读本
《Machine learning is teaching us the secret to teaching 》
介绍:机器学习教会了咱们什么?
《scikit-learn:用于机器学习的 Python 模块》
介绍:scikit-learn 是在 SciPy 基础上构建的用于机器学习的 Python 模块。
《对话机器学习大神 Michael Jordan:解析领域中各种模型》
介绍:乔丹教授(Michael I. Jordan)教授是机器学习领域神经网络的大牛,他对深度学习、神经网络有着很浓厚的兴趣。所以,不少提问的问题中包含了机器学习领域的各种模型,乔丹教授对此一一作了解释和展望。
《A*搜索算法的可视化短教程》
介绍:A*搜索是人工智能基本算法,用于高效地搜索图中两点的最佳路径, 核心是 g (n) +h(n): g (n)是从起点到顶点n的实际代价,h(n)是顶点n到目标顶点的估算代价。合集
《基于云的天然语言处理开源项目 FudanNLP》
介绍:本项目利用了 Microsoft Azure,能够在几分种内完成 NLP on Azure Website 的部署,当即开始对 FNLP 各类特性的试用,或者以 REST API 的形式调用 FNLP 的语言分析功能
《吴立德《几率主题模型&数据科学基础》》
介绍:现任复旦大学首席教授、计算机软件博士生导师。计算机科学研究所副所长.内部课程
《机器学习入门资源不彻底汇总》》
介绍:好东西的干货真的不少
《收集从 2014 年开始深度学习文献》
介绍:从硬件、图像到健康、生物、大数据、生物信息再到量子计算等,Amund Tveit 等维护了一个 DeepLearning.University 小项目:收集从 2014 年开始深度学习文献,相信能够做为深度学习的起点,github
《EMNLP 上两篇关于股票趋势的应用论文 》
介绍:EMNLP 上两篇关于 stock trend 用到了 deep model 组织特征; Exploiting Social Relations and Sentiment for Stock Prediction 用到了 stock network。
《Bengio 组(蒙特利尔大学 LISA 组)深度学习教程 》
介绍:做者是深度学习一线大牛 Bengio 组写的教程,算法深刻显出,还有实现代码,一步步展开。
《学习算法的 Neural Turing Machine 》
介绍:许多传统的机器学习任务都是在学习 function,不过谷歌目前有开始学习算法的趋势。谷歌另外的这篇学习 Python 程序的 Learning to Execute 也有类似之处
《Learning to Rank for Information Retrieval and Natural Language Processing》
介绍:做者是华为技术有限公司,诺亚方舟实验室,首席科学家的李航博士写的关于信息检索与天然语言处理的文章
《Rumor has it: Identifying Misinformation in Microblogs》
介绍:利用机用器学习在谣言的判别上的应用,此外还有两个。一个是识别垃圾与虚假信息的 paper.还有一个是网络舆情及其分析技术
《R机器学习实践》
介绍:该课程是网易公开课的收费课程,不贵,超级便宜。主要适合于对利用R语言进行机器学习,数据挖掘感兴趣的人。
《大数据分析:机器学习算法实现的演化》
介绍:本章中做者总结了三代机器学习算法实现的演化:第一代非分布式的, 第二代工具如 Mahout 和 Rapidminer 实现基于 Hadoop 的扩展,第三代如 Spark 和 Storm 实现了实时和迭代数据处理。BIG DATA ANALYTICS BEYOND HADOOP
《图像处理,分析与机器视觉》
介绍:讲计算机视觉的四部奇书(应该叫经典吧)之一,另外三本是 Hartley 的《多图几何》、Gonzalez 的《数字图像处理》、Rafael C.Gonzalez / Richard E.Woods 的《数字图像处理》
《LinkedIn 最新的推荐系统文章 Browsemaps》
介绍:里面基本没涉及到具体算法,但做者介绍了 CF 在 LinkedIn 的不少应用,以及他们在作推荐过程当中得到的一些经验。最后一条经验是应该监控 log 数据的质量,由于推荐的质量很依赖数据的质量!
《初学者如何查阅天然语言处理(NLP)领域学术资料》
介绍:初学者如何查阅天然语言处理(NLP)领域学术资料
《树莓派的人脸识别教程》
介绍:用树莓派和相机模块进行人脸识别
《利用深度学习与大数据构建对话系统 》
介绍:如何利用深度学习与大数据构建对话系统
《经典论文 Leo Breiman:Statistical Modeling: The Two Cultures 》
介绍:Francis Bach 合做的有关稀疏建模的新综述(书):Sparse Modeling for Image and Vision Processing,内容涉及 Sparsity, Dictionary Learning, PCA, Matrix Factorization 等理论,以及在图像和视觉上的应用,并且第一部分关于 Why does the l1-norm induce sparsity 的解释也很不错。
《Reproducing Kernel Hilbert Space》
介绍:RKHS 是机器学习中重要的概念,其在 large margin 分类器上的应用也是广为熟知的。若是没有较好的数学基础,直接理解 RKHS 可能会不易。本文从基本运算空间讲到 Banach 和 Hilbert 空间,深刻浅出,一共才 12 页。
《Hacker's guide to Neural Networks》
介绍:许多同窗对于机器学习及深度学习的困惑在于,数学方面已经大体理解了,可是动起手来殊不知道如何下手写代码。斯坦福深度学习博士 Andrej Karpathy 写了一篇实战版本的深度学习及机器学习教程,手把手教你用 Javascript 写神经网络和 SVM.
《【语料库】语料库资源汇总》
介绍:【语料库】语料库资源汇总
《机器学习算法之旅》
介绍:本文会过一遍最流行的机器学习算法,大体了解哪些方法可用,颇有帮助。
《Reproducible Research in Computational Science》
介绍:这个里面有不少关于机器学习、信号处理、计算机视觉、深刻学习、神经网络等领域的大量源代码(或可执行代码)及相关论文。科研写论文的好资源
《NYU 2014 年的深度学习课程资料》
介绍:NYU 2014 年的深度学习课程资料,有视频
《计算机视觉数据集不彻底汇总》
介绍:计算机视觉数据集不彻底汇总
《Machine Learning Open Source Software》
介绍:机器学习开源软件
《LIBSVM》
介绍:A Library for Support Vector Machines
《Support Vector Machines》
介绍:数据挖掘十大经典算法之一
《100 Best GitHub: Deep Learning》
介绍:github 上面 100 个很是棒的项目
《加州大学欧文分校(UCI)机器学习数据集仓库》
介绍:当前加州大学欧文分校为机器学习社区维护着 306 个数据集。查询数据集
《Andrej Karpathy 我的主页》
介绍:Andrej Karpathy 是斯坦福大学 Li Fei-Fei 的博士生,使用机器学习在图像、视频语义分析领域取得了科研和工程上的突破,发的文章很少,但每一个都很扎实,在每个问题上都作到了 state-of-art.
《Andrej Karpathy 的深度强化学习演示》
介绍:Andrej Karpathy 的深度强化学习演示,论文在这里
《CIKM 数据挖掘竞赛夺冠算法-陈运文》
介绍:CIKM Cup (或者称为 CIKM Competition)是 ACM CIKM 举办的国际数据挖掘竞赛的名称。
《Geoffrey E. Hinton》
介绍:杰弗里·埃弗里斯特·辛顿 FRS 是一位英国出生的计算机学家和心理学家,以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推进者.
《天然语言处理的深度学习理论与实际》
介绍:微软研究院深度学习技术中心在 CIKM2014 上关于《天然语言处理的深度学习理论与实际》教学讲座的幻灯片
《用大数据和机器学习作股票价格预测》
介绍: 本文基于<支持向量机的高频限价订单的动态建模>采用了 Apache Spark 和 Spark MLLib 从纽约股票交易所的订单日志数据构建价格运动预测模型。(股票有风险,投资谨慎) GitHub 源代码托管地址.
《关于机器学习的若干理论问题》
介绍:徐宗本院士将于热爱机器学习的小伙伴一块儿探讨有关于机器学习的几个理论性问题,并给出一些有意义的结论。最后经过一些实例来讲明这些理论问题的物理意义和实际应用价值。
《深度学习在天然语言处理的应用》
介绍:做者还著有《这就是搜索引擎:核心技术详解》一书,主要是介绍应用层的东西
《Undergraduate machine learning at UBC》
介绍:机器学习课程
《人脸识别必读的N篇文章》
介绍:人脸识别必读文章推荐
《推荐系统经典论文文献及业界应用》
介绍:推荐系统经典论文文献
《人脸识别必读的N篇文章》
介绍:人脸识别必读文章推荐
《第十二届中国"机器学习及其应用"研讨会 PPT》
介绍:第十二届中国"机器学习及其应用"研讨会 PPT
《统计机器学习》
介绍:统计学习是关于计算机基于数据构建的几率统计模型并运用模型对数据进行预测和分析的一门科学,统计学习也成为统计机器学习。课程来自上海交通大学
《机器学习导论》
介绍:机器学习的目标是对计算机编程,以便使用样本数据或以往的经验来解决给定的问题.
《CIKM 2014 主题报告的幻灯片》
介绍:CIKM 2014 Jeff Dean、Qi Lu、Gerhard Weikum 的主题报告的幻灯片, Alex Smola、Limsoon Wong、Tong Zhang、Chih-Jen Lin 的 Industry Track 报告的幻灯片
《人工智能和机器学习领域有趣的开源项目》
介绍:部分中文列表
《机器学习经典算法详解及 Python 实现--基于 SMO 的 SVM 分类器》
介绍:此外做者还有一篇元算法、AdaBoost python 实现文章
《Numerical Optimization: Understanding L-BFGS》
介绍:加州伯克利大学博士 Aria Haghighi 写了一篇超赞的数值优化博文,从牛顿法讲到拟牛顿法,再讲到 BFGS 以及L-BFGS, 图文并茂,还有伪代码。强烈推荐。
《简明深度学习方法概述(一)》
介绍:还有续集简明深度学习方法概述(二)
《R language for programmers》
介绍:R语言程序员私人定制版
《谷歌地图解密:大数据与机器学习的结合》
介绍:谷歌地图解密
《空间数据挖掘经常使用方法》
介绍:空间数据挖掘经常使用方法
《Use Google's Word2Vec for movie reviews》
介绍:Kaggle 新比赛 ”When bag of words meets bags of popcorn“ aka ”边学边用 word2vec 和 deep learning 作 NLP“ 里面全套教程教一步一步用 python 和 gensim 包的 word2vec 模型,并在实际比赛里面比调参数和清数据。 若是已装过 gensim 不要忘升级
《PyNLPIR》
介绍:PyNLPIR 提供了 NLPIR/ICTCLAS 汉语分词的 Python 接口,此外 Zhon 提供了经常使用汉字常量,如 CJK 字符和偏旁,中文标点,拼音,和汉字正则表达式(如找到文本中的繁体字)
《深度卷积神经网络下围棋》
介绍:这文章说把最近模型识别上的突破应用到围棋软件上,打 16 万张职业棋谱训练模型识别功能。想法不错。训练后目前能作到不用计算,只看棋盘就给出下一步,大约 10 级棋力。但这篇文章太过乐观,说什么人类的最后一块堡垒立刻就要跨掉了。话说得太早。不过,若是与别的软件结合应该还有潜力可挖。@万精油墨绿
《NIPS 审稿实验》
介绍:UT Austin 教授 Eric Price 关于今年 NIPS 审稿实验的详细分析,他表示,根据此次实验的结果,若是今年 NIPS 从新审稿的话,会有一半的论文被拒。
《2014 年最佳的大数据,数据科学文章》
介绍:KDNuggets 分别总结了 2014 年 14 个阅读最多以及分享最多的文章。咱们从中能够看到多个主题——深度学习,数据科学家职业,教育和薪酬,学习数据科学的工具好比R和 Python 以及大众投票的最受欢迎的数据科学和数据挖掘语言
《机器学习经典算法详解及 Python 实现--线性回归(Linear Regression)算法》
介绍:Python 实现线性回归,做者还有其余很棒的文章推荐能够看看
《2014 中国大数据技术大会 33 位核心专家演讲 PDF》
介绍:2014 中国大数据技术大会 33 位核心专家演讲 PDF 下载
《使用 RNN 和 Paragraph Vector 作情感分析》
介绍:这是T. Mikolov & Y. Bengio 最新论文 Ensemble of Generative and Discriminative Techniques for Sentiment Analysis of Movie Reviews ,使用 RNN 和 PV 在情感分析效果不错,[项目代码](https://github.com/mesnilgr/iclr15) 公布在 github (目前是空的)。这意味着 Paragraph Vector 终于揭开面纱了嘛。
《NLPIR/ICTCLAS2015 分词系统大会上的技术演讲 》
介绍:NLPIR/ICTCLAS2015 分词系统发布与用户交流大会上的演讲,请更多朋友检阅新版分词吧。 咱们实验室同窗的演讲包括:孙梦姝-基于评论观点挖掘的商品搜索技术研究 李然-主题模型
《Machine Learning is Fun!》
介绍:Convex Neural Networks 解决维数灾难
《CNN 的反向求导及练习》
介绍:介绍 CNN 参数在使用 bp 算法时该怎么训练,毕竟 CNN 中有卷积层和下采样层,虽然和 MLP 的 bp 算法本质上相同,但形式上仍是有些区别的,很显然在完成 CNN 反向传播前了解 bp 算法是必须的。此外做者也作了一个资源集:机器学习,深度学习,视觉,数学等
《正则表达式优化成 Trie 树 》
介绍:若是要在一篇文章中匹配十万个关键词怎么办?Aho-Corasick 算法利用添加了返回边的 Trie 树,可以在线性时间内完成匹配。 但若是匹配十万个正则表达式呢 ? 这时候能够用到把多个正则优化成 Trie 树的方法,如日本人写的 Regexp::Trie
《Deep learning Reading List》
介绍:深度学习阅读清单
《Caffe》
介绍:Caffe 是一个开源的深度学习框架,做者目前在 google 工做,做者主页 Yangqing Jia (贾扬清)
《GoogLeNet 深度学习模型的 Caffe 复现 》
介绍:2014 ImageNet 冠军 GoogLeNet 深度学习模型的 Caffe 复现模型,GoogleNet 论文.
《LambdaNet,Haskell 实现的开源人工神经网络库 》
介绍:LambdaNetLambdaNet 是由 Haskell 实现的一个开源的人工神经网络库,它抽象了网络建立、训练并使用了高阶函数。该库还提供了一组预约义函数,用户能够采起多种方式组合这些函数来操做现实世界数据。
《百度余凯&张潼机器学习视频》
介绍:若是你从事互联网搜索,在线广告,用户行为分析,图像识别,天然语言理解,或者生物信息学,智能机器人,金融预测,那么这门核心课程你必须深刻了解。
《杨强在 TEDxNanjing 谈智能的起源》
介绍:"人工智能研究分许多流派。其中之一以 IBM 为表明,认为只要有高性能计算就可获得智能,他们的‘深蓝’击败了世界象棋冠军;另外一流派认为智能来自动物本能;还有个很强的流派认为只要找来专家,把他们的思惟用逻辑一条条写下,放到计算机里就行……" 杨强在 TEDxNanjing 谈智能的起源
《深度 RNN/LSTM 用于结构化学习 0) 序列标注 Connectionist Temporal ClassificationICML06》
介绍:1) 机器翻译 Sequence to Sequence NIPS14 2) 成分句法 GRAMMAR AS FOREIGN LANGUAGE
《Deep Learning 实战之 word2vec》
介绍:网易有道的三位工程师写的 word2vec 的解析文档,从基本的词向量/统计语言模型->NNLM->Log-Linear/Log-Bilinear->层次化 Log-Bilinear,到 CBOW 和 Skip-gram 模型,再到 word2vec 的各类 tricks,公式推导与代码,基本上是网上关于 word2vec 资料的大合集,对 word2vec 感兴趣的朋友能够看看
《Machine learning open source software》
介绍:机器学习开源软件,收录了各类机器学习的各类编程语言学术与商业的开源软件.与此相似的还有不少例如:DMOZ - Computers: Artificial Intelligence: Machine Learning: Software, LIBSVM -- A Library for Support Vector Machines, Weka 3: Data Mining Software in Java, scikit-learn:Machine Learning in Python, Natural Language Toolkit:NLTK, MAchine Learning for LanguagE Toolkit, Data Mining - Fruitful and Fun, Open Source Computer Vision Library
《机器学习入门者学习指南》
介绍:做者是计算机研二(写文章的时候,如今是 2015 年了应该快要毕业了),专业方向天然语言处理.这是一点他的经验之谈.对于入门的朋友或许会有帮助
《A Tour of Machine Learning Algorithms》
介绍:这是一篇关于机器学习算法分类的文章,很是好
《2014 年的《机器学习日报》大合集》
介绍:机器学习日报里面推荐不少内容,在这里有一部分的优秀内容就是来自机器学习日报.
《 Image classification with deep learning 经常使用模型》
介绍:这是一篇关于图像分类在深度学习中的文章
《自动语音识别:深度学习方法》
介绍:做者与 Bengio 的兄弟 Samy 09 年合编《自动语音识别:核方法》 3)李开复 1989 年《自动语音识别》专著,其博导、94 年图灵奖得主 Raj Reddy 做序
《NLP 中的中文分词技术》
介绍: 做者是 360 电商技术组成员,这是一篇 NLP 在中文分词中的应用
《Using convolutional neural nets to detect facial keypoints tutorial》
介绍: 使用 deep learning 的人脸关键点检测,此外还有一篇 AWS 部署教程
《书籍推荐:Advanced Structured Prediction》
介绍: 由 Sebastian Nowozin 等人编纂 MIT 出版的新书《Advanced Structured Prediction》http://t.cn/RZxipKG ,聚集告终构化预测领域诸多牛文,涉及 CV、NLP 等领域,值得一读。网上公开的几章草稿:一,二,三,四,五
《An Introduction to Matrix Concentration Inequalities》
介绍: Tropp 把数学家用高深装逼的数学语言写的矩阵几率不等式用初等的方法写出来,是很是好的手册,领域内的 paper 各类证实都在用里面的结果。虽然说是初等的,但仍是很是的难
《The free big data sources you should know》
介绍: 不容错过的免费大数据集,有些已是耳熟能详,有些可能仍是第一次据说,内容跨越文本、数据、多媒体等,让他们伴你开始数据科学之旅吧,具体包括:Data.gov、US Census Bureau、European Union Open Data Portal、Data.gov.uk 等
《A Brief Overview of Deep Learning》
介绍: 谷歌科学家、Hinton 亲传弟子 Ilya Sutskever 的深度学习综述及实际建议
《A Deep Dive into Recurrent Neural Nets》
介绍: 很是好的讨论递归神经网络的文章,覆盖了 RNN 的概念、原理、训练及优化等各个方面内容,强烈推荐!本文做者 Nikhil Buduma 还有一篇 Deep Learning in a Nutshell 值得推荐
《机器学习:学习资源》
介绍:里面融合了不少的资源,例如竞赛,在线课程,demo,数据整合等。有分类
《Statistical foundations of machine learning》
介绍:《机器学习的统计基础》在线版,该手册但愿在理论与实践之间找到平衡点,各主要内容都伴有实际例子及数据,书中的例子程序都是用R语言编写的。
《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介绍:IVAN VASILEV 写的深度学习导引:从浅层感知机到深度网络。高可读
《Research priorities for robust and beneficial artificial intelligence》
介绍:鲁棒及有益的人工智能优先研究计划:一封公开信,目前已经有 Stuart Russell, Tom Dietterich, Eric Horvitz, Yann LeCun, Peter Norvig, Tom Mitchell, Geoffrey Hinton, Elon Musk 等人签署 The Future of Life Institute (FLI).这封信的背景是最近霍金和 Elon Musk 提醒人们注意 AI 的潜在威胁。公开信的内容是 AI 科学家们站在造福社会的角度,展望人工智能的将来发展方向,提出开发 AI 系统的 Verification,Validity, Security, Control 四点要求,以及须要注意的社会问题。毕竟当前 AI 在经济领域,法律,以及道德领域相关研究较少。其实还有一部美剧《疑犯追踪》,介绍了 AI 的演进从一开始的自我学习,过滤,图像识别,语音识别等判断危险,到第四季的时候出现了机器经过学习成长以后想控制世界的状态。说到这里推荐收看。
《metacademy》
介绍:里面根据词条提供了许多资源,还有相关知识结构,路线图,用时长短等。号称是”机器学习“搜索引擎
《FAIR open sources deep-learning modules for Torch》
介绍:Facebook 人工智能研究院(FAIR)开源了一系列软件库,以帮助开发者创建更大、更快的深度学习模型。开放的软件库在 Facebook 被称做模块。用它们替代机器学习领域经常使用的开发环境 Torch 中的默认模块,能够在更短的时间内训练更大规模的神经网络模型。
《浅析人脸检测之 Haar 分类器方法》
介绍:本文虽然是写于 2012 年,可是这篇文章彻底是做者的经验之做。
《如何成为一位数据科学家》
介绍:本文是对《机器学习实战》做者 Peter Harrington 作的一个访谈。包含了书中部分的疑问解答和一点我的学习建议
《Deep learning from the bottom up》
介绍:很是好的深度学习概述,对几种流行的深度学习模型都进行了介绍和讨论
《Hands-On Data Science with R Text Mining》
介绍:主要是讲述了利用R语言进行数据挖掘
《Understanding Convolutions》
介绍:帮你理解卷积神经网络,讲解很清晰,此外还有两篇 Conv Nets: A Modular Perspective,Groups & Group Convolutions. 做者的其余的关于神经网络文章也很棒
《Introduction to Deep Learning Algorithms》
介绍:Deep Learning 算法介绍,里面介绍了 06 年 3 篇让 deep learning 崛起的论文
《Learning Deep Architectures for AI》
介绍:一本学习人工智能的书籍,做者是 Yoshua Bengio,相关国内报道
《Geoffrey E. Hinton 我的主页》
介绍:Geoffrey Hinton 是 Deep Learning 的大牛,他的主页放了一些介绍性文章和课件值得学习
《PROBABILITY THEORY: THE LOGIC OF SCIENCE》
介绍:几率论:数理逻辑书籍
《H2O》
介绍:一个用来快速的统计,机器学习而且对于数据量大的数学库
《ICLR 2015 会议的 arXiv 稿件合集》
介绍:在这里你能够看到最近深度学习有什么新动向。
《Introduction to Information Retrieval》
介绍:此书在信息检索领域家喻户晓, 除提供该书的免费电子版外,还提供一个 IR 资源列表 ,收录了信息检索、网络信息检索、搜索引擎实现等方面相关的图书、研究中心、相关课程、子领域、会议、期刊等等,堪称全集,值得收藏
参考资料:
巨头转身物联网,物联网的下一站是人工智能:https://zhuanlan.zhihu.com/p/21957944
https://www.zhihu.com/question/31497611
值得咱们深度学习的十大开源框架:http://www. devstore.cn/essay/essayInfo/3734.html
自学成才秘籍!机器学习&深度学习经典资料汇总:http://www.techxue.com/techxue-12746-1.html
近200篇机器学习&深度学习资料分享(含各类文档,视频,源码等):http://developer.51cto.com/art/201501/464174.htm
一文读懂机器学习,大数据/天然语言处理/算法全有了:http://www.open-open.com/lib/view/open1420615208000.html
计算机的潜意识:http://www.cnblogs.com/subconscious/default.html?page=1
机器学习最佳入门学习资料汇总:http://article.yeeyan.org/view/22139/410514