首頁猿問如何標記熊貓數(shù)據(jù)幀中的最后一個重復(fù)元素

如何標記熊貓數(shù)據(jù)幀中的最后一個重復(fù)元素

Python

守著星空守著你 2022-01-05 19:35:02

如您所知，有一種.duplicated在列中查找重復(fù)項的方法，但我需要的是知道我的數(shù)據(jù)按日期排序的最后一個重復(fù)元素。這是Last_dup該列的預(yù)期結(jié)果Policy_id：Id Policy_id Start_Date Last_dup0 b123 2019/02/24 01 b123 2019/03/24 02 b123 2019/04/24 13 c123 2018/09/01 04 c123 2018/10/01 15 d123 2017/02/24 06 d123 2017/03/24 1在此先感謝您的幫助和支持！

查看完整描述

2 回答

慕的地8271018

TA貢獻1796條經(jīng)驗獲得超4個贊

使用Series.duplicated或DataFrame.duplicated指定列和參數(shù)keep='last'，然后將反轉(zhuǎn)掩碼轉(zhuǎn)換為整數(shù)以True/False進行1/0映射或使用numpy.where：

df['Last_dup1'] = (~df['Policy_id'].duplicated(keep='last')).astype(int)

df['Last_dup1'] = np.where(df['Policy_id'].duplicated(keep='last'), 0, 1)

或者：

df['Last_dup1'] = (~df.duplicated(subset=['Policy_id'], keep='last')).astype(int)

df['Last_dup1'] = np.where(df.duplicated(subset=['Policy_id'], keep='last'), 0, 1)

print (df)

Id Policy_id Start_Date Last_dup Last_dup1

0 0 b123 2019/02/24 0 0

1 1 b123 2019/03/24 0 0

2 2 b123 2019/04/24 1 1

3 3 c123 2018/09/01 0 0

4 4 c123 2018/10/01 1 1

5 5 d123 2017/02/24 0 0

6 6 d123 2017/03/24 1 1

反對回復(fù) 2022-01-05

蕪湖不蕪

TA貢獻1796條經(jīng)驗獲得超7個贊

也可以通過下面提到的方式完成（不使用Series.duplicated）：

dictionary = df[['Id','Policy_id']].set_index('Policy_id').to_dict()['Id']

#here the dictionary values contains the most recent Id's

df['Last_dup'] = df.Id.apply(lambda x: 1 if x in list(dictionary.values()) else 0)

反對回復(fù) 2022-01-05

2 回答
0 關(guān)注
142 瀏覽

關(guān)注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何標記熊貓數(shù)據(jù)幀中的最后一個重復(fù)元素

如何標記熊貓數(shù)據(jù)幀中的最后一個重復(fù)元素

2 回答

添加回答