唐宇迪:51CTO微职位讲师,计算机博士,人工智能专家html
内容梗概:介绍人工智能学习步骤和知识框架。人工智能的学习能够拆分为7步,此为1-3步:上篇。git
要学人工智能(数据科学)这行仍是须要一些基本功的,最基础也是最核心的就是Python和数学了!这两兄弟入门起来并不难,先掌握基础的边用边学也是能够的!github
若是对Python不熟悉的同窗们,建议先看一下个人Python入门视频课程,能够快速入门!免费学习连接:https://edu.51cto.com/course/8399.html面试
为何是Python?
最直接的解释就是你们都用它!之前是面向对象编程,后来你们更喜欢面向复制粘贴编程,如今懒到面向github编程,确实如此,该偷懒就得偷懒,Python就是这个做用!后续全部的实战内容都是基于Python,因此没得选啦!算法
须要安装什么?
Anaconda就够了!Anaconda就够了!Anaconda就够了!好了,说了三遍了,具体解释你们参考上面传送门课程就好编程
什么是工具包?
工具包就是人家把功能都写好了,我们直接调用就完事啦!数据处理,分析,建模等都有对应的工具包。对于学习来讲并不用把这些工具包背下来,先熟悉起来,后续确定仍是要现用现查的。网络
工具包名称 | 功能概述 |
---|---|
Numpy | 矩阵计算必备!它是后续一切计算的核心,数据科学领域核心工具包 |
Pandas | 数据处理必备!读数据,处理数据,分析数据,非他不可! |
Matplotlib | 可视化必备!功能十分强大,没有画不出来的图,分析展现就靠它了! |
Seaborn | 更简单的可视化神器!一行代码给你搞定一个可视化展现结果 |
我跟你们来解释一下,人工智能这行发展至关迅速,在实际工做中确定要边干边学,学什么呢?想必就是当下的一些优秀论文了,若是连基本的数学公式都看不懂,那就不用再去谈什么高端技术了。作这行的同窗们确定都会有这样一个想法,所谓的人工智能就是对数据作各类各样的数学计算罢了!框架
我最常作的一件事就是用到什么查什么,查找的过程其实也是学习进步过程。建议你们能够快速过一遍经常使用的知识点(高数,线性,几率论中的基础),这个过程当中千万别去看各类解题过程,也不用管具体求解的方法,说白了就是只要理解一个公式是作什么的,有什么用就足够了,相似教材中的习题,练习册上的求解这些通通不须要,之后也根本不会用笔去算这些麻烦事,把这个时间省下来去学习算法更划得来!机器学习
下面是课程中所设计的知识点,也是必备基础ide
知识点 | 内容 | 做用 |
---|---|---|
高等数学 | 高等数学基础,微积分,泰勒公式与拉格朗日 | 机器学习公式推导必备 |
线性代数 | 线性代数基础,特征值与矩阵分解 | 算法求解必备 |
几率论 | 几率论基础,随机变量与几率估计,经常使用分布 | 机器学习常常提这些词 |
统计分析 | 回归分析,假设检验,相关分析,方差分析 | 数据分析必备 |
人工智能领域最核心的就是机器学习了,不管你们后续想从事哪一个方向,确定都是先从机器学习开始!主要就两件事,第一就是掌握经典算法原理,第二就是熟练应用Python工具包进行建模实战!
我以为对算法的学习确定不止一遍,尤为是准备面试就业的同窗们,二刷,三刷都是很正常的现象(曾经有同窗跟我说面试前一共刷了6遍课程)
下面是课程中会讲解的算法,也是你们必须掌握的!这里没有列出全部机器学习算法,由于有不少如今已经不实用了。
知识点 | 内容 | 概述 |
---|---|---|
分类算法 | 逻辑回归,决策树,支持向量机,集成算法,贝叶斯算法 | 准备面试的同窗们必须掌握 |
回归算法 | 线性回归,决策树,集成算法 | 有些算法既能作分类也能作回归 |
聚类算法 | k-means,dbscan等 | 无监督是实在没标签的时候才考虑的 |
降维算法 | 主成分分析,线性判别分析等 | 重在理解降维的思想 |
进阶算法 | GBDT提高算法,lightgbm,,EM算法,隐马尔科夫模型 | 进阶算法有时间精力的同窗们能够挑战 |
经过对比实验分析经典算法建模方法及其参数对结果的影响,经过实验与可视化展现理解算法中的参数与应用实例。
案例名称 | 内容概述 |
---|---|
线性回归实验分析 | 掌握一元与多元线性回归,非线性回归方法,正则化惩罚的做用 |
模型评估方法 | 经常使用分类与回归算法评估方法对比,数据集切分实例 |
逻辑回归实验分析 | 经典分类模型构造方法,决策树边界绘制方法 |
聚类算法实验分析 | 无监督建模实例,聚类算法评估方法,无监督的做用与应用实例 |
决策树实验分析 | 树模型可视化实例与构造方法,树模型的分类与回归应用 |
集成算法实验分析 | 集成方法应用实例与效果分析,常见集成策略对比 |
支持向量机实验分析 | SVM涉及参数与建模对比实验 |
关联规则实战分析 | 关联规则必备知识点与建模分析实例 |
为了更好理解算法的机制从零开始复现经典算法,坚持不掉包原则,一步步完成算法所需全部模块。
案例名称 | 内容概述 |
---|---|
线性回归代码实现 | 分模块构建算法经常使用函数 |
逻辑回归代码实现 | 实例解读逻辑回归实现方法 |
Kmeans代码实现 | 很是简单易懂的无监督算法 |
决策树代码实现 | 树模型其实就是递归实现 |
神经网络代码实现 | 代码量略大,建议debug模式学习 |
贝叶斯代码实现 | 贝叶斯在文本任务中仍是比较好解释 |
关联规则代码实现 | 经常使用的数据分析算法 |
打造音乐推荐系统 | 从零开始构造推荐系统模型 |
归纳来讲就是要完成不一样的任务所需流程和套路都是相似的,可是使用的方法和算法却可能不一样,这就须要你们不断积累来丰富实战经验了。给同窗们提供的这些案例你们均可以看成是本身的实战模板!
案例名称 | 内容概述 |
---|---|
K近邻算法实战 | 机器学习入门案例,掌握工具包应用于建模方法 |
交易数据异常检测 | 十分重要,数据处理和建模策略的详细分析对比 |
集成算法建模实战 | 集成不用我多说了,必备核心策略 |
基于随机森林的气温预测 | 随机森林是机器学习中最经常使用的算法,详细分析对比 |
新闻分类实战 | 文本数据分析处理,基于贝叶斯算法展开建模实战 |
聚类实践分析 | 无监督应用实例 |
时间序列分析 | 时间序列数据制做方法,基于序列数据进行建模 |
用户流失预警 | 我常常说梦幻西游的用户流失,这个只是个DEMO |
使用lightgbm进行饭店流量预测 | 又是一个大杀器,比xgboost还虎 |
人口普查数据集项目实战-收入预测 | 核心模板,数据分析,可视化啥的该有的都有 |
贝叶斯优化实战 | 难度较大,贝叶斯优化工具包使用实例 |
文本特征方法对比 | 文本数据经常使用特征提取方法对比 |
制做本身经常使用工具包 | 本身作个包玩玩 |
这里还给你们准备了丰富的实战项目,很是适合你们来练手!
案例名称 | 内容概述 |
---|---|
Python实战关联规则 | 用工具包来作关联规则实在过轻松了 |
爱彼迎数据集分析与建模 | 房价数据集分析与建模实例 |
基于类似度的酒店推荐系统 | 来构建一个推荐系统完成酒店推荐 |
商品销售额回归分析 | 销售额预测,很常规的任务,常规套路搞定 |
绝地求生数据集探索分析与建模 | 绝地求生数据集,来看看你究竟被什么人干掉了 |
模型解释方法实战 | 建模后如何来解释模型呢,这几个工具包帮你搞定 |
天然语言处理必备工具包实战 | NLP经常使用工具包解读,实例演示 |
银行客户还款可能性预测 | 银行客户数据来预测还款的可能性 |
图像特征聚类分析实践 | 图像数据如何进行聚类呢? |
人口普查数据集项目实战-收入预测 | 核心模板,数据分析,可视化啥的该有的都有 |
数据分析这个词你们每天都在听,要干什么呢?无非就是从数据中获取有价值的信息,这其中方法与套路仍是很是多的。 这个方向不须要什么理论积累,直接上数据,干就得了!案例的积累就是学习过程!
案例名称 | 内容概述 |
---|---|
泰坦尼克号获救预测 | 经典的kaggle竞赛案例,入门数据挖掘的第一个实战项目 |
数据特征构建 | 特征工程是数据挖掘的核心,基于sklearn讲解多种特征构建方法 |
用户画像实战 | 用户画像想必你们都听过了,如何应用数据来完成画像呢? |
集成策略实例 | 数据挖掘中选择一般都选择集成策略来更好的提高效果 |
Xgboost实战 | 集成中的典型表明,竞赛的大杀器 |
京东购买意向预测 | 经典预测问题,基于用户历史行为数据完成预测任务 |
kaggle数据科学调查 | 可视化展现kaggle竞赛中参赛人员状况 |
房价预测 | 数据挖掘入门级别案例,快速掌握常规套路 |
电力敏感用户分析 | 竞赛实例,主要讲解特征工程的做用 |
fbprophet时间序列预测 | 时间序列预测很是实用的算法,用起来很是简单 |
案例名称 | 内容概述 |
---|---|
快手短视频用户活跃度分析 | 基于用户的行为数据来预测接下来的活跃程度 |
工业化工生产预测 | 对化工数据进行分析,建模预测生产效率 |
智慧城市-道路通行时间预测 | 很接地气的竞赛,基于道路数据预测通行时间 |
特征工程建模可解释工具包 | 数据挖掘中很难的一点就是进行特征解释,这些工具包很是实用 |
医学糖尿病数据命名实体识别 | 命名实体识别算法讲解与应用实例分析 |
贷款平台风控模型-特征工程 | 用图模型来构建特征工程,这套思路应用很广 |
新闻关键词抽取模型 | 关键词抽取能够说是NLP必备技能了 |
机器学习项目实战模板 | 模板来了,之后有任务能够套用了,方法都差很少 |
电力敏感用户分析 | 竞赛实例,主要讲解特征工程的做用 |
案例名称 | 内容概述 |
---|---|
散点图绘制技巧 | 都说了可视化是重点,画图确定必须的了 |
纽约出租车运行状况分析建模 | 用了好多工具包,能够熟悉下对地理数据如何进行分析与展现 |
基于统计分析的电影推荐任务 | 统计分析经常使用方法,还能作推荐 |
数据分析与机器学习模板 | 这个模板真的很是全面了,分析,展现,建模,评估,简直一套龙了 |
数据降维 | 几种经常使用的降维算法对比分析与展现 |
商品可视化展现与文本处理 | 文本数据预处理与可视化展现 |
多变量分析 | 多变量分析也是数据分析中常见的方法 |
商品订单数据集分析 | 订单数据集分析 |
KIVA贷款数据分析 | 贷款数据集分析 |
点击图片查看唐宇迪讲师亲自授课的微职位