欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

虚构的含义12138

程序员文章站 2024-02-22 11:46:40
...

前言

什么是虚构

一.认识什么是虚构的

请同学们了解什么是虚构的什么是虚拟变量

二.使用

我们先来了解一下什么是虚拟的

虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到两个方程的作用,而且接近现实。
例如,反映文化程度的虚拟变量可取为:1:本科学历;0:非本科学历
一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。

接下来让我们来看看一个虚拟的例子:

import pandas as pd
testdata = pd.read_csv("C://Users//TD//Desktop//1.csv")
from sklearn import preprocessing
testdata["疾病名称"].head()
0    败血症(成人)
1    败血症(成人)
2    脑出血和脑梗死
3    脑出血和脑梗死
4    脑出血和脑梗死
Name: 疾病名称, dtype: object

factor=pd.get_dummies(testdata["疾病名称"],prefix='疾病名称')
factor
   疾病名称_创伤性颅脑损伤  疾病名称_前列腺增生  ...  疾病名称_败血症(成人)  疾病名称_高血压病(成人)
0               0           0  ...             1              0
1               0           0  ...             1              0
2               0           0  ...             0              0
 

 让我们来看下一个小例子,我想=相信通过这个小例子的学习大家一定能学费

#构建虚拟变量


woli_giao = pd.concat([toubaoren_giao.loc[:,['半年保费覆盖额', '半年账单金额', '半年支付金额','半年支付笔数','年龄']],
                        pd.get_dummies(toubaoren_giao['性别']),
                        pd.get_dummies(toubaoren_giao['治疗措施编码']),
                        pd.get_dummies(toubaoren_giao['保险条款'])],axis = 1)
woli_giao

该处使用的url网络请求的数据。


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

相关标签: 中文分词