用Pandas庫中的drop_duplicates()去重無效
,以下是相關(guān)部分代碼。用下面的代碼得到的結(jié)果是帶有重復行的,這意味著drop_duplicates()沒有起作用。程序執(zhí)行完成后,我再單獨執(zhí)行去重的語句,結(jié)果又是正確的。不知道問題出在哪里。求老師解答?。?!
如果路徑/文件存在
? ? if os.path.exists(filepath):
? ?? ???#讀取已有數(shù)據(jù)
? ?? ???data_road_exist = pd.read_excel(filepath)
? ?? ???#將新增數(shù)據(jù)追加到原有數(shù)據(jù)中
? ?? ???data_road_exist = data_road_exist.append(road_rank ,ignore_index=True)
? ?? ???#去除重復數(shù)據(jù)
? ?? ???data_road_exist.drop_duplicates()
? ?? ???#將數(shù)據(jù)寫入指定文件
? ?? ???out = pd.ExcelWriter(filepath)
? ?? ???data_road_exist.to_excel(out)
? ?? ???out.save()
? ? else:
? ?? ???pd.DataFrame.to_excel(road_rank,filepath)
2018-03-05
drop_duplicates()是一個執(zhí)行方法,就是說它的效果只是將去重后的結(jié)果輸出(如果是寫在最后一行),它不是將去重后的結(jié)果再返回給去重目標。因此,你要想得到你想要的結(jié)果,需要data_road_exist=data_road_exist.drop_duplicates()
2018-01-26
.drop_duplicates(data_road_exist)?