【逻辑回归预测 算法评价】
逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型,并且广泛应用于各个领域之中。虽然现在深度学习相对于这些传统方法更为火热,但实则这些传统方法由于其独特的优势依然广泛应用于各个领域中。
而对于逻辑回归而且,最为突出的两点就是其模型简单和模型的可解释性强。
逻辑回归模型的优劣势:
优点:实现简单,易于理解和实现;计算代价不高,速度很快,存储资源低;
缺点:容易欠拟合,分类精度可能不高
。
一、使用步骤
1.引入库
代码如下(示例):
import pandas as pdimport numpy as npfrom sklearn import model_selectionfrom sklearn import metricsfrom sklearn.linear_model import LogisticRegression
2.读入数据
代码如下(示例):
filename='bankloan.xls'data=pd.read_excel(filename)print(data.shape)x=data.iloc[:,[1,2,4,5,6]]y=data.iloc[:,8]
3.数据分割
从原始数据中选取一半进行训练,另一半进行数据测试
代码如下(示例):
x_train,x_test,y_train,y_test = model_selection.train_test_split(x,y,test_size = 0.1,random_state = 9)print(x_train)print(x_test)print(y_train)print(y_test)lr = LogisticRegression()lr.fit(x_train,y_train)print(u'逻辑回归模型训练结束。')
4.模型评价
print(u'模型的平均正确率为:%s'% lr.score(x_train,y_train))y_pred = lr.predict(x_test)#预测Y值print(y_pred)print(y_test.shape)#查看测试结果print(metrics.confusion_matrix(y_test,y_pred))#查看混淆矩阵print(metrics.classification_report(y_test,y_pred))#评估报告print("测试集的正确率:\n",lr.score(x_test,y_test))
开发者涨薪指南
48位大咖的思考法则、工作方式、逻辑体系