金融贷款逾期的模型实现

程序员文章站 2022-06-25 08:24:30

数据集的下载地址为 https://pan.baidu.com/s/1dtHJiV6zMbf_fWPi-dZ95g 我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签：0表示未逾期，1表示逾期。先对数据进行三七分，随机种子2018。这里利用了LR,SVM,DecisionTr ......

数据集的下载地址为 https://pan.baidu.com/s/1dthjiv6zmbf_fwpi-dz95g

我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签：0表示未逾期，1表示逾期。

先对数据进行三七分，随机种子2018。这里利用了lr,svm,decisiontree三种模型，并对这三种模型进行评分。

数据划分

先导入划分数据和构建模型所需要的各种包。用read_csv函数打开csv文件。接着再对数据集进行三七划分。在获取训练集的时候，可以用列表推导法，也可以用drop函数，不过要注意再删除列的时候要将 axis = 1

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import logisticregression
from sklearn.tree import decisiontreeclassifier
from sklearn import svm

data_all = pd.read_csv('d:\\data_all.csv',encoding='gbk')

#features = [x for x in data_all.columns if x not in ['status']]
#x = data_all[features]
x = data_all.drop(['status'],axis = 1)
y = data_all['status']
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3,random_state=2018)

三种模型的训练与评分

下一步就是分别构建是三种模型了。

#lr
lr = logisticregression(random_state = 2018)
lr.fit(x_train, y_train)
#decisiontree
dt = decisiontreeclassifier(random_state = 2018)
dt.fit(x_train , y_train)
#svm
svc = svm.svc(random_state = 2018)
svc.fit(x_train , y_train)
#打印三种模型的得分
print(dt.score(x_test,y_test))
print(lr.score(x_test,y_test))
print(svc.score(x_test,y_test))

最后得到三种模型的评分

0.6846531184302733
0.7484232655921513
0.7484232655921513

上一篇：深入理解Mysql索引的底层数据结构 B+ Tree （1）

下一篇：用SQL语句实现：当A列大于B列时选择A列否则选择B列，当B列大于C列时选择B列否则选择C列。

金融贷款逾期的模型实现

数据划分

三种模型的训练与评分

go代码实现买房贷款月供计算的方法

Python多线程的简单实现（生产者消费者模型）

Tensorflow实现在训练好的模型上进行测试

Laravel Eloquent分表方法并使用模型关联的实现

PHP+redis实现微博的拉模型案例详解

大数据在互联网金融P2P贷款中的应用

ThinkPHP实现非标准名称数据表快速创建模型的方法

PHP+redis实现微博的推模型案例分析

浅谈生产者消费者模型(Linux系统下的两种实现方法)

PHP实现MVC开发得最简单的方法——模型