第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

如何標記熊貓數(shù)據(jù)幀中的最后一個重復(fù)元素

如何標記熊貓數(shù)據(jù)幀中的最后一個重復(fù)元素

守著星空守著你 2022-01-05 19:35:02
如您所知,有一種.duplicated在列中查找重復(fù)項的方法,但我需要的是知道我的數(shù)據(jù)按日期排序的最后一個重復(fù)元素。這是Last_dup該列的預(yù)期結(jié)果Policy_id:Id  Policy_id   Start_Date  Last_dup0   b123        2019/02/24  01   b123        2019/03/24  02   b123        2019/04/24  13   c123        2018/09/01  04   c123        2018/10/01  15   d123        2017/02/24  06   d123        2017/03/24  1在此先感謝您的幫助和支持!
查看完整描述

2 回答

?
慕的地8271018

TA貢獻1796條經(jīng)驗 獲得超4個贊

使用Series.duplicated或DataFrame.duplicated指定列和參數(shù)keep='last',然后將反轉(zhuǎn)掩碼轉(zhuǎn)換為整數(shù)以True/False進行1/0映射或使用numpy.where:


df['Last_dup1'] = (~df['Policy_id'].duplicated(keep='last')).astype(int)

df['Last_dup1'] = np.where(df['Policy_id'].duplicated(keep='last'), 0, 1)

或者:


df['Last_dup1'] = (~df.duplicated(subset=['Policy_id'], keep='last')).astype(int)

df['Last_dup1'] = np.where(df.duplicated(subset=['Policy_id'], keep='last'), 0, 1)

print (df)

   Id Policy_id  Start_Date  Last_dup  Last_dup1

0   0      b123  2019/02/24         0          0

1   1      b123  2019/03/24         0          0

2   2      b123  2019/04/24         1          1

3   3      c123  2018/09/01         0          0

4   4      c123  2018/10/01         1          1

5   5      d123  2017/02/24         0          0

6   6      d123  2017/03/24         1          1


查看完整回答
反對 回復(fù) 2022-01-05
?
蕪湖不蕪

TA貢獻1796條經(jīng)驗 獲得超7個贊

也可以通過下面提到的方式完成(不使用Series.duplicated):


dictionary = df[['Id','Policy_id']].set_index('Policy_id').to_dict()['Id']

#here the dictionary values contains the most recent Id's

df['Last_dup'] = df.Id.apply(lambda x: 1 if x in list(dictionary.values()) else 0)


查看完整回答
反對 回復(fù) 2022-01-05
  • 2 回答
  • 0 關(guān)注
  • 142 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號