在监督学习中咱们有一个数据集,这个数据集被称训练集。算法
𝑚 表明训练集中实例的数量函数
𝑥 表明特征/输入变量学习
𝑦 表明目标变量/输出变量
(𝑥, 𝑦) 表明训练集中的实例
(𝑥(𝑖), 𝑦(𝑖)) 表明第𝑖 个观察实例spa
ℎ 表明学习算法的解决方案或函数也称为假设(hypothesis)class
这就是一个监督学习算法的工做方式,能够看到这里有咱们的训练集里房屋价格
咱们把它喂给咱们的学习算法,学习算法的工做了,而后输出一个函数,一般表示为小写 ℎ
表示。ℎ 表明hypothesis(假设),ℎ表示一个函数,输入是房屋尺寸大小,就像你朋友想出售
的房屋,所以 ℎ 根据输入的 𝑥值来得出 𝑦 值,𝑦 值对应房子的价格 所以,ℎ 是一个从𝑥
到 𝑦 的函数映射。
我将选择最初的使用规则ℎ表明hypothesis,于是,要解决房价预测问题,咱们实际上
是要将训练集“喂”给咱们的学习算法,进而学习获得一个假设ℎ,而后将咱们要预测的房屋
的尺寸做为输入变量输入给ℎ,预测出该房屋的交易价格做为输出变量输出为结果。那么,
对于咱们的房价预测问题,咱们该如何表达 ℎ?
一种可能的表达方式为:ℎ𝜃(𝑥) = 𝜃0 + 𝜃1𝑥,由于只含有一个特征/输入变量,所以这样
的问题叫做单变量线性回归问题。变量