pandas(三)

程序员文章站 2022-03-20 15:26:20

合并数据集：创建一个能创建dataframe的函数 def make_data(cols,ind): data={c:[strc(c)+str(i) for i in ind] for c in cols} return pd.DataFrame(data,ind) make_data('ABC' ......

合并数据集：

　　创建一个能创建dataframe的函数

　　def make_data(cols,ind):

　　　　data={c:[strc(c)+str(i) for i in ind]

　　　　　　for c in cols}

　　　　return pd.dataframe(data,ind)

　　　make_data('abc',range(3))

一维数组

ser1 = pd.series(['a','b','c'],index=[1,2,3])

ser2 = pd.series(['d','e','f'],index=[4,5,6])

pd.concat([ser1,ser2])　　

二维数组

df1 = make_data('ab',[1,2])

df2 = make_data('ab',[3,4])

pd.concat([df1,df2]) 默认逐行合并axis=0(上下合并)

pandas 在合并索引时会保留索引，即使是重复的

触发索引重复异常：

veriy_integrity参数可以触发索引重复异常

try:

　　pd.concat([x,y],verify_integrity=true)

except valueerror as e:

　　print('v')

忽略索引重复异常：

ignore_index可以实现忽略原先索引重新创建一个整数索引

当列名有相同也有不相同时

join,join_axes

join默认参数是outer 取两个数组的并集

inner指取两个数组的交集

append效果和concat相同

df1.append（df2）

重复列名 suffixes

df8 = pd.dataframe({'name':['a','b','c'],'rank':[1,2,3]})

df9 = pd.dataframe({'name':['a','b','c'],'rank':[4,5,6]})

pd.merge(df8,df9,on='name',suffixes=['_l','_r'])

merge效果和concat相同，on表示以name这一列为基础合并，suffixes表示将相同的两列区分

上一篇： C语言入门学习笔记之typedef简介

下一篇：希尔伯特曲线——第八届蓝桥杯国赛第三题

pandas(三)

详解Vue Elementui中的Tag与页面其它元素相互交互的两三事

基于Pandas读取csv文件Error的总结

微信公众平台开发（PHP）（三）订阅事件（subscribe）处理

从零开始学YII2框架（三）扩展插件yii2-gird_PHP

class.rFastTemplate.php三

解决pandas read_csv 读取中文列标题文件报错的问题

使用NumPy和pandas对CSV文件进行写操作的实例

图论算法总结之三：最短路径算法

LaTeX三线表格设置

图论算法（三）最短路径

pandas(三)

详解Vue Elementui中的Tag与页面其它元素相互交互的两三事

基于Pandas读取csv文件Error的总结

微信公众平台开发（PHP）（三） 订阅事件（subscribe）处理

从零开始学YII2框架（三）扩展插件yii2-gird_PHP

class.rFastTemplate.php三

解决pandas read_csv 读取中文列标题文件报错的问题

使用NumPy和pandas对CSV文件进行写操作的实例

图论算法总结之三：最短路径算法

LaTeX三线表格设置

图论算法（三）最短路径

微信公众平台开发（PHP）（三）订阅事件（subscribe）处理