首頁(yè) 猿問(wèn) 如何根據(jù)熊貓中組合的最高出現(xiàn)次數(shù)填寫(xiě)值？

如何根據(jù)熊貓中組合的最高出現(xiàn)次數(shù)填寫(xiě)值？

Python

BIG陽(yáng) 2021-09-11 20:24:12

我有一個(gè)巨大的 df 看起來(lái)像這樣 -... || City || Country Newyork USA Newyork USA Newyork USA Newyork **unknown** delhi india delhi **unknown** delhi india現(xiàn)在，我想根據(jù)已匹配的城市用正確的國(guó)家/地區(qū)填充未知數(shù)。例如，大多數(shù)帶有 newyork 的行在 country 列中都是 USA。我的想法是按國(guó)家/地區(qū)分組并將其轉(zhuǎn)換為字典以進(jìn)行映射，但這種方法失敗了。這是一個(gè)類(lèi)似的問(wèn)題，但解決方案是在 R 中：根據(jù)發(fā)生概率填充缺失值

查看完整描述

2 回答

PIPIONE

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超9個(gè)贊

您可以使用每個(gè)組的value_counts第一個(gè)索引或第一個(gè)值：modereplace

def f(x):

#remove '**unknown**' rows and get top1 value

return x.replace('**unknown**', x[x.ne('**unknown**')].value_counts().index[0])

#return x.replace('**unknown**', x[x.ne('**unknown**')].mode().iat[0])

df['Country'] = df.groupby('City')['Country'].apply(f)

print (df)

City Country

0 Newyork USA

1 Newyork USA

2 Newyork USA

3 Newyork USA

4 delhi india

5 delhi india

6 delhi india

另一種解決方案是替換**unknown**缺失值，獲取最高值和fillna：

df['Country'] = df['Country'].replace('**unknown**', np.nan)

s = df.groupby('City')['Country'].transform(lambda x: x.value_counts().index[0])

#alternative

#s = df.groupby('City')['Country'].transform(lambda x: x.mode().iat[0])

df['Country'] = df['Country'].fillna(s)

print (df)

City Country

0 Newyork USA

1 Newyork USA

2 Newyork USA

3 Newyork USA

4 delhi india

5 delhi india

6 delhi india

反對(duì) 回復(fù) 2021-09-11

2 回答
0 關(guān)注
183 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

如何根據(jù)熊貓中組合的最高出現(xiàn)次數(shù)填寫(xiě)值？

如何根據(jù)熊貓中組合的最高出現(xiàn)次數(shù)填寫(xiě)值？

2 回答

添加回答

如何根據(jù)熊貓中組合的最高出現(xiàn)次數(shù)填寫(xiě)值？

如何根據(jù)熊貓中組合的最高出現(xiàn)次數(shù)填寫(xiě)值？