首頁(yè) 猿問(wèn) 根據(jù)列中的重復(fù)值有條件地復(fù)制數(shù)據(jù)

根據(jù)列中的重復(fù)值有條件地復(fù)制數(shù)據(jù)

Python

慕尼黑8549860 2022-06-28 18:10:20

我希望根據(jù)現(xiàn)有的金融交易數(shù)據(jù)框創(chuàng)建一個(gè)新的數(shù)據(jù)框，但前提是特定列中有重復(fù)值。為簡(jiǎn)單起見，我有df13 列：'a' 'b' 'c'和數(shù)百行。b當(dāng)列中的值重復(fù) 3 次或更多次時(shí)，我想復(fù)制所有行。換句話說(shuō)，如果 3 行或更多行具有相同的b值，我希望將那些復(fù)制到df2.我試過(guò)了df2 = df1.where(df1.b.value_counts() > 2)但這會(huì)將所有行變?yōu)镹aN. 我希望指出正確的方向，而不是繼續(xù)猜測(cè)和檢查其他代碼。

查看完整描述

2 回答

PIPIONE

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超9個(gè)贊

groupy()與_np.where()

考慮這個(gè)樣本：

>>> df = pd.DataFrame({'id':[1,2,3,4,5], 'tag': ['a','a','a','d','e']})

>>> df

id tag

0 1 a

1 2 a

2 3 a

3 4 d

4 5 e

>>> df['counter'] = df.groupby(['tag'])['tag'].transform('count')

>>> df

id tag counter

0 1 a 3

1 2 a 3

2 3 a 3

3 4 d 1

4 5 e 1

>>> df['counter'] = np.where(df['counter'] > 2, ['Retain'], ['Remove'])

>>> df

id tag counter

0 1 a Retain

1 2 a Retain

2 3 a Retain

3 4 d Remove

4 5 e Remove

>>> df = df[df['counter'].isin(['Retain'])]

>>> df

id tag counter

0 1 a Retain

1 2 a Retain

2 3 a Retain

反對(duì) 回復(fù) 2022-06-28

蠱毒傳說(shuō)

TA貢獻(xiàn)1895條經(jīng)驗(yàn) 獲得超3個(gè)贊

添加一列標(biāo)記要保留的值，然后按此過(guò)濾：

# Make a boolean series as a mapping of values with more than 2 counts

more_than_2_values = df1.b.value_counts() > 2

# Add a new column that indicates which values should be kept

df1["more_than_2"] = df["b"].map(more_than_2_values).fillna(False)

# Filter the data, drop the label column if desired

desired_result = df1[df1["more_than_2"].drop(columns="more_than_2"]

反對(duì) 回復(fù) 2022-06-28

2 回答
0 關(guān)注
118 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

根據(jù)列中的重復(fù)值有條件地復(fù)制數(shù)據(jù)

根據(jù)列中的重復(fù)值有條件地復(fù)制數(shù)據(jù)

2 回答

添加回答