欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

第20节_定位、消除重复数据

程序员文章站 2022-06-16 20:45:21
...
dupe = students.duplicated(subset='Name', inplace=Ture,keep=first)	 #subset可以是列表.

dupe = students.drop_duplicates(subset='Name', inplace=True, keep='last')	#last,保留最后一个出现的,默认保留第一个出现的  
dupe = students.duplicated(subset='Name')		
dupe = dupe[dupe == True]  # dupe = dupe[dupe]		#打印重复的返回布尔值

分析

print(dupe)		#打印所有重复的
print(dupe.any())		#一个表,返回一个Ture
print(type(dupe))		series

最终得到重复的数据

print(students.iloc[dupe.index])

第20节_定位、消除重复数据

相关标签: pandas