欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

pandas-定位消除重复数据

程序员文章站 2022-06-02 12:52:05
...
import pandas as pd
student = pd.read_excel('C:/Users/zuxia/Downloads/020/Students_Duplicates.xlsx')
#去掉数据中的重复数据
# student.drop_duplicates(subset='Name',inplace=True,keep='last')
# print(student)
#找出重复数据
dupe = student.duplicated(subset='Name')
dupe = dupe[dupe]
print(student.iloc[dupe.index])