第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

刪除相對于某些行重復(fù)的所有行

刪除相對于某些行重復(fù)的所有行

有只小跳蛙 2021-05-07 10:19:03
我已經(jīng)看到了幾個類似的問題,但對我的情況卻不是令人滿意的答案。這是一個示例DataFrame:+------+-----+----+|    id|value|type|+------+-----+----+|283924|  1.5|   0||283924|  1.5|   1||982384|  3.0|   0||982384|  3.0|   1||892383|  2.0|   0||892383|  2.5|   1|+------+-----+----+我只想通過"id"和"value"列來識別重復(fù)項,然后刪除所有實例。在這種情況下:第1行和第2行是重復(fù)的(同樣,我們忽略了“類型”列)第3行和第4行是重復(fù)的,因此僅應(yīng)保留第5行和第6行:輸出為:+------+-----+----+|    id|value|type|+------+-----+----+|892383|  2.5|   1||892383|  2.0|   0|+------+-----+----+我試過了df.dropDuplicates(subset = ['id', 'value'], keep = False)但是“保持”功能不在PySpark中(因為它在中)pandas.DataFrame.drop_duplicates。我還能怎么做?
查看完整描述

2 回答

  • 2 回答
  • 0 關(guān)注
  • 130 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號