那特征工程究竟是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。文中分享了人们对特征工程的概括和总结以及一些数据处理。
python
很是全面的一篇学习资料
git
关于 Kaggle 的简介
程序员
你在工做、学习中是否曾因信息过载叫苦连天?有一种方法可以替你读海量文章,并将不一样的主题和对应的关键词抽取出来,让你谈笑间观其大略。本文使用Python对超过1000条文本作主题抽取,一步步带你体会非监督机器学习LDA方法的魅力。想不想试试呢?
github
Scikit-learn 秘籍 第五章 模型后处理
面试
这篇文章向你们推荐一份用户友好型的机器学习教程。
算法
Awesome-TensorFlow-Chinese,TensorFlow 中文资源精选,官方网站,安装教程,入门教程,实战项目,学习路径。
数据库
做为一个非 CS 科班的互联网从业者,确实对于 AI 这个领域一直远而避之,想了想高数,建模,大数据,算法这些词汇,都会有点头发麻的感受。可是又不能彻底不懂吧,本身打算写下这个 List,用于搜集科普性的人工智能领域的文章,但愿和你们一块儿学习。但愿也能够快点加入这个热门的圈子。
编程
这篇文章根据做者自己学习计算机科学的经验,给出了学习机器学习理论的这一系列文章,可以填补自主学习机器学习的理论与实践之间的差距,从而在征途上少一些艰辛。
网络
一份较全面的机器学习的学习资料,涵盖了 Awesome 系列,Deep Learning,Frameworks,TensorFlow,RNN & LSTM 等等。
app
机器学习、深度学习与天然语言处理领域推荐的书籍列表 是笔者 Awesome Reference 系列的一部分;对于其余的资料、文章、视频教程、工具实践请参考面向程序猿的数据科学与机器学习知识体系及资料合集。本文算是抛砖引玉,笔者最近有空就会在 Pad 上面随手翻阅这些书籍,但愿可以了解其余优秀的书籍。
我认为李老师的课程风格风趣幽默而又很是负责,既能融入Pokemon等有趣的applications,也会用十几张PPT来细致地推导公式算法。
很是推荐你们用李宏毅老师的课程来入门,特别是对英语基础不够扎实的同窗,固然主流Coursera、Udacity的课程也是很是专业而全面的。
好文章
本文的重点是实现,并不会从理论和概念上详细解释深度神经网络、卷积神经网络、最优化方法等基本内容。可是机器之心发过许多详细解释的入门文章或教程,所以,咱们但愿读者能先了解如下基本概念和理论。固然,本文注重实现,即便对深度学习的基本算法理解不那么深一样仍是能实现本文所述的内容。
A Mindmap summarising Machine Learning concepts, from Data Analysis to Deep Learning.
Machine Learning is a subfield of computer science th…
【数据分析师的基本素养】论如何成为一名数据科学家
http://click.aliyun.com/m/10280/
这是本人在知乎上翻译的文章, 陆续更新中,如今搬运到掘金上来。 在这一系列文章中,你将学到深度学习的一些基本概念以及TensorFlow的使用,并完成手写体数字识别、图像分类、迁移学习、Deep Dream、风格迁移和强化学习等项目。 github上的Python NoteBoo…
机器学习的数据分为三类:训练集、验证集和测试集,刚开始看 tensorflow 时一直没搞懂验证集是作什么的。
AUC值 Area Under Curve score (曲线下面积值),也就是ROC曲线之下与坐标轴围成的面积。 这两个指标通常做为衡量二分类器的度量,为何要有这个测试指标,源自于一种二分类器的思考。若是咱们有一件事情的为1的几率为99%,0的几率为1%,则若是咱们不通过处…
不一样于其余KNN的入门,这篇文章直接采用卷积神经网络介绍机器学习。好像不学点机器学习就很亏?
从基础到进阶,还有做者分享的一些资源。
背景:一直有朋友但愿我能介绍下自学机器学习、数据挖掘的经历,然而当我认真回首研究生这两年半,发现浪掉的时间居多,学习的时间太少,积累还不够(虽然校招季收获比较多的数据挖掘相关offer,其实人脉、运气、面试经验等其余因素占了很大比重)。因此在此只能聊聊一些浅显的认识,各位姑妄听之。
本文受众:有兴趣自学机器学习、数据挖掘的学生或程序员(也欢迎科班研究生、业界大拿拍砖,多多提出批评建议,先行谢过)
Python 能够说是如今最流行的机器学习语言,并且你也能在网上找到大量的资源。你如今也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你本身的努力了。
介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning.
《Deep Learning in Neural Networks: An Overview》 介绍:这是瑞士人工智能实验室Jurge…
本文用一系列「思惟导图」由浅入深的总结了「统计学」领域的基础知识
在机器学习和数据挖掘的应用中,scikit-learn 是一个功能强大的 python 包。在数据量不是过大的状况下,能够解决大部分问题。学习使用 scikit-learn 的过程当中,我本身也在补充着机器学习和数据挖掘的知识。这里根据本身学习 sklearn 的经验,我作一个总结的笔记。
这篇文章为你们整理出 370 门精选的免费高质量编程计算机科学类的课程(涵盖程序语言、人工智能、深度学习与机器学习等热门话题)。这 370 门课程是从 Class Central 数据库里面的 7000 门课程挑选出来的,每一个课程的 Rating(评价)也是由该网站上获取下来的平均值。
继续棒!
若是想知道神经网络原理和实现的,就赶忙戳开连接阅读和查看吧
咱们知道,机器学习的特色就是:以计算机为工具和平台,以数据为研究对象,以学习方法为中心;是几率论、线性代数、数值计算、信息论、最优化理论和计算机科学等多个领域的交叉学科。因此本文就先介绍一下机器学习涉及到的一些最经常使用的的数学知识。
1、 加载 sklearn 中的数据集 datasets
from sklearn import datasets
iris = datasets.load_iris() # 鸢尾花卉数据
digits = datasets.load_digits() # 手写数字 8x8 像素信息数据
1
2
3
4
1
2
3
4
查看数据的信息
print iris.data[:4] # 查看数据的特征信息
print iris.data.shape # 查看数据的特征信息维度
print iris.target_names # 查看标签对应的文本
print iris.target[:4] # 查看数据的标签 setosa:0 ...
做者的机器学习笔记整理。机器学习、深度学习、决策树、决策树应用已经 KNN,SVM 算法等等