課程
                    
                        /后端開發(fā)
                        
                            /Python
                        
                        /Python在數(shù)據(jù)科學中的應用

用Pandas庫中的drop_duplicates()去重無效

,以下是相關(guān)部分代碼。用下面的代碼得到的結(jié)果是帶有重復行的，這意味著drop_duplicates()沒有起作用。程序執(zhí)行完成后，我再單獨執(zhí)行去重的語句，結(jié)果又是正確的。不知道問題出在哪里。求老師解答?。?！

如果路徑/文件存在
? ? if os.path.exists(filepath):
? ?? ???#讀取已有數(shù)據(jù)
? ?? ???data_road_exist = pd.read_excel(filepath)
? ?? ???#將新增數(shù)據(jù)追加到原有數(shù)據(jù)中
? ?? ???data_road_exist = data_road_exist.append(road_rank ,ignore_index=True)

? ?? ???#去除重復數(shù)據(jù)
? ?? ???data_road_exist.drop_duplicates()

? ?? ???#將數(shù)據(jù)寫入指定文件
? ?? ???out = pd.ExcelWriter(filepath)
? ?? ???data_road_exist.to_excel(out)
? ?? ???out.save()
? ? else:
? ?? ???pd.DataFrame.to_excel(road_rank,filepath)

寅恪乎

2018-01-06

源自：Python在數(shù)據(jù)科學中的應用 6-2

關(guān)注問題我要回答

8154

操作

收起

2 回答

qq_醉意流年_2 回答被采納 +2 積分
2018-03-05

drop_duplicates()是一個執(zhí)行方法，就是說它的效果只是將去重后的結(jié)果輸出（如果是寫在最后一行），它不是將去重后的結(jié)果再返回給去重目標。因此，你要想得到你想要的結(jié)果，需要data_road_exist=data_road_exist.drop_duplicates()