我有一個看起來像這樣的數(shù)據(jù)框 TaskID Status Time 0 123 Progress 12.001 234 Progress 12.102 123 Almost Done 12.203 234 Completed 12.40我需要使用最新記錄更新記錄的狀態(tài)而不更改其他列的值并刪除最新的重復記錄。最后結果 TaskID Status Time 0 123 Almost Done 12.001 234 Completed 12.10我怎樣才能做到這一點?謝謝。
1 回答

繁星淼淼
TA貢獻1775條經(jīng)驗 獲得超11個贊
我相信您需要agg使用first和 聚合last:
df = df.groupby('TaskID', as_index=False).agg({'Status':'last','Time':'first'})
print (df)
TaskID Status Time
0 123 Almost Done 12.0
1 234 Completed 12.1
添加回答
舉報
0/150
提交
取消