from sklearn.processing import StandardSacler sc = StandardScaler() #实例化 sc.fit(X_train) sc.transform(X_train) # - 以上两句能够并写成一句sc.fit_transform(X_trian) # - 咱们使用相同的放缩参数分别对训练和测试数据集以保证他们的值是彼此至关的。**可是在使用fit_transform 只能对训练集使用,而测试机则只使用fit便可。** # - sklearn中的metrics类中包含了不少的评估参数,其中accuracy_score, # - 中accuracy_score(y_test,y_pred),也就是那y_test与预测值相比较,得出正确率 y_pred = model.predict(X_test-std)
过拟合现象出现有两个缘由:python
感知机的一个最大缺点是:在样本不是彻底线性可分的状况下,它永远不会收敛。
分类算中的另外一个简单高效的方法:logistics regression(分类模型)算法
特定的事件的发生的概率,用数学公式表示为:$\frac{p}{1-p} $,其中p为正事件的几率,不必定是有利的事件,而是咱们将要预测的事件。以一个患者患有某种疾病的几率,咱们能够将正事件的类标标记为y=1。
机器学习
参考文献:函数