最近看有人发了机器学习的培训挺便宜的,就尝试了一下。python
讲的比较基础,很适合入门,用来了解这个行业。即便不从事此行业,用工具去画一个数学模型的图也是好的。浏览器
其余的各类机器学习概念,高数离散等数学基础知识都同样,没什么可写的。机器学习
只有安装的工具和使用方法,值得记录一下。ide
到anaconda官网,下载安装就行,不过记住安装的时候选上注册环境变量,要否则使用起来麻烦。工具
打开命令终端,执行命令conda install jupyter学习
打开命令终端,执行jupyter notebook,而后发现它会自动打开你的浏览器,显示一个页面。spa
(1)把要分析的文件在操做页面上上传,code
(2)在右侧有个"new"按钮,点击new->python3orm
(3)在命令终端上执行机器学习代码:blog
import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression #显示前几行 data = pd.read_csv("data/Advertising.csv") data.head() #查看列标题 data.columns #数据可视化 plt.figure(figsize=(16,8)) plt.scatter(data['TV'],data['sales'],c='black') plt.xlabel("Money spent on TV ads") plt.ylabel("Sales") plt.show() #训练线性回归模型 x = data['TV'].values.reshape(-1,1) y = data['sales'].values.reshape(-1,1) reg = LinearRegression() reg.fit(x,y) #打印结果 print('a = {:.5}'.format(reg.coef_[0][0])) print('b = {:.5}'.format(reg.intercept_[0])) print("线性模型为:Y = {:.5}X + {:.5} ".format(reg.coef_[0][0], reg.intercept_[0])) #画出预测曲线 predictions = reg.predict(x) plt.figure(figsize=(16, 8)) plt.scatter(data['TV'], data['sales'], c = 'black') plt.plot(data['TV'], predictions, c = 'blue', linewidth=2) plt.xlabel("Money spent on TV ads") plt.ylabel("Sales") plt.show() #预测当投入100亿时的结果 predictions = reg.predict([[100]]) print('投入一亿元的电视广告,预计的销售量为{:.5}亿'.format( predictions[0][0])) predictions = reg.predict([[100],[200],[300]]) print('投入一亿、二亿、三亿元的电视广告,预计的销售量分别为为{:.5}、{:.5}、{:.5}亿'.format( predictions[0][0], predictions[1][0], predictions[2][0]))
基本的入门流程就是这样,剩下的就是学习各类数学模型,用需求驱动,各类实践了。
参考地址: