人工智能学习过程当中,遇到的常见问题锦集(一)

  • 表格类数据作曲线拟合时,假设函数是如何肯定的?

【问题以下】算法

像房价预测这样的表格类数据回归问题,咱们当时的假设:“函数是线性的,也就是13个特征和房价之间的关系是一次方关系。”结果证实,效果还不错。而后,你好,我好,你们都好!框架

那么问题来了:机器学习

一、你是如何提早知道他们是线性关系的?ide

二、进一步说,在作曲线拟合时,假设函数是如何肯定的?函数

【参考思路】工具

下面,我先抛砖,欢迎你们拍砖:学习

首先,没有办法能直接得出曲线是什么样的,试想若是能的话,咱们还须要机器学习吗?直接用基于规则的算法,岂不是更高效?人工智能

其次,在实际工做中,每每是靠合理的“猜”来进行不断的尝试,最后达到一个效率和准确率的折中。it

通常作法:class

一、先作数据的归一化,统一量纲,让全部特征在进行训练前“人人平等”;

二、若是能够的话,能够用一些降维算法(好比PCA,t-SNE)来把特征降到2维,这样就能够利用Matplotlib等可视化工具来画一个三维图像,协助判断一下曲线的走势;

三、进一步说,能够简单粗暴直接上,先用线性回归来尝试,看效果;若是不行,那就再试二次方回归;还不行,就再试三次方回归 ... 你们还记得泰勒级数或是泰勒公式吧?他老人家已经证实了,只要阶数够高,无论你多复杂,我均可以拟合个差很少...

四、整个过程看上去很复杂,其实sklearn的多项式回归,很简单,几行代码就搞定。这个时候,你应该会很是感谢那些开源框架的做者们,让咱们能够垂手可得的验证咱们的想法 ...

实践证实:线性回归这种既简单又高效的算法,是最经常使用的,不少实际问题均可以搞定,因此,从线性回归开始尝试,没毛病 ...

欢迎拍砖!!!

若是喜欢个人文章欢迎一块儿探讨:

人工智能学习过程当中,遇到的常见问题锦集(一)

相关文章
相关标签/搜索