【问题以下】算法
像房价预测这样的表格类数据回归问题,咱们当时的假设:“函数是线性的,也就是13个特征和房价之间的关系是一次方关系。”结果证实,效果还不错。而后,你好,我好,你们都好!框架
那么问题来了:机器学习
一、你是如何提早知道他们是线性关系的?ide
二、进一步说,在作曲线拟合时,假设函数是如何肯定的?函数
【参考思路】工具
下面,我先抛砖,欢迎你们拍砖:学习
首先,没有办法能直接得出曲线是什么样的,试想若是能的话,咱们还须要机器学习吗?直接用基于规则的算法,岂不是更高效?人工智能
其次,在实际工做中,每每是靠合理的“猜”来进行不断的尝试,最后达到一个效率和准确率的折中。it
通常作法:class
一、先作数据的归一化,统一量纲,让全部特征在进行训练前“人人平等”;
二、若是能够的话,能够用一些降维算法(好比PCA,t-SNE)来把特征降到2维,这样就能够利用Matplotlib等可视化工具来画一个三维图像,协助判断一下曲线的走势;
三、进一步说,能够简单粗暴直接上,先用线性回归来尝试,看效果;若是不行,那就再试二次方回归;还不行,就再试三次方回归 ... 你们还记得泰勒级数或是泰勒公式吧?他老人家已经证实了,只要阶数够高,无论你多复杂,我均可以拟合个差很少...
四、整个过程看上去很复杂,其实sklearn的多项式回归,很简单,几行代码就搞定。这个时候,你应该会很是感谢那些开源框架的做者们,让咱们能够垂手可得的验证咱们的想法 ...
实践证实:线性回归这种既简单又高效的算法,是最经常使用的,不少实际问题均可以搞定,因此,从线性回归开始尝试,没毛病 ...
欢迎拍砖!!!
若是喜欢个人文章欢迎一块儿探讨: