体验机器学习编程

时间 2019-12-09

标签体验机器学习编程繁體版

原文原文链接

最近看有人发了机器学习的培训挺便宜的，就尝试了一下。python

讲的比较基础，很适合入门，用来了解这个行业。即便不从事此行业，用工具去画一个数学模型的图也是好的。浏览器

其余的各类机器学习概念，高数离散等数学基础知识都同样，没什么可写的。机器学习

只有安装的工具和使用方法，值得记录一下。ide

1.安装anaconda

到anaconda官网，下载安装就行，不过记住安装的时候选上注册环境变量，要否则使用起来麻烦。工具

2.安装jupyter notebook

打开命令终端，执行命令conda install jupyter学习

3.启动jupyter notebook

打开命令终端，执行jupyter notebook，而后发现它会自动打开你的浏览器，显示一个页面。spa

4.执行程序

(1)把要分析的文件在操做页面上上传，code

(2)在右侧有个"new"按钮，点击new->python3orm

(3)在命令终端上执行机器学习代码：blog

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
#显示前几行
data = pd.read_csv("data/Advertising.csv")
data.head()

#查看列标题
data.columns

#数据可视化
plt.figure(figsize=(16,8))
plt.scatter(data['TV'],data['sales'],c='black')
plt.xlabel("Money spent on TV ads")
plt.ylabel("Sales")
plt.show()

#训练线性回归模型
x = data['TV'].values.reshape(-1,1)
y = data['sales'].values.reshape(-1,1)

reg = LinearRegression()
reg.fit(x,y)

#打印结果
print('a = {:.5}'.format(reg.coef_[0][0]))
print('b = {:.5}'.format(reg.intercept_[0]))

print("线性模型为：Y = {:.5}X + {:.5} ".format(reg.coef_[0][0], reg.intercept_[0]))

#画出预测曲线
predictions = reg.predict(x)
plt.figure(figsize=(16, 8))
plt.scatter(data['TV'], data['sales'], c = 'black')
plt.plot(data['TV'], predictions, c = 'blue', linewidth=2)
plt.xlabel("Money spent on TV ads")
plt.ylabel("Sales")
plt.show()

#预测当投入100亿时的结果
predictions = reg.predict([[100]])
print('投入一亿元的电视广告，预计的销售量为{:.5}亿'.format( predictions[0][0]))

predictions = reg.predict([[100],[200],[300]])
print('投入一亿、二亿、三亿元的电视广告，预计的销售量分别为为{:.5}、{:.5}、{:.5}亿'.format( predictions[0][0], predictions[1][0], predictions[2][0]))

View Code

基本的入门流程就是这样，剩下的就是学习各类数学模型，用需求驱动，各类实践了。

参考地址：

https://zhuanlan.zhihu.com/c_1122543639770791936