首頁(yè) 猿問(wèn) Python groupby...

Python groupby 嵌套字典在聚合中存在歧義

Python

繁星淼淼 2023-05-09 10:53:00

我目前正在研究我的論文，并且在我想做的 groupby 函數(shù)中面臨一些問(wèn)題。我想找出某人的總購(gòu)買量、平均購(gòu)買量、購(gòu)買次數(shù)、總共購(gòu)買了多少產(chǎn)品以及每件產(chǎn)品的平均價(jià)值。數(shù)據(jù)看起來(lái)像這樣： id purchase_amount price_products #_products0 123 30 20.00 22 123 NaN 10.00 NaN3 124 50.00 25.00 34 124 NaN 15.00 NaN5 124 NaN 10.00 NaN我的代碼如下所示：df.groupby('id')[['purchase_amount','price_products','#_products']].agg(total_purchase_amount=('purchase_amount','sum'),average_purchase_amount=('purchase_amount','mean'),times_purchased=('#_products','count'),total_amount_products_purchased=('price_products','count'),average_value_products=('price_products','mean'))但我收到以下錯(cuò)誤：SpecificationError：嵌套字典在聚合中不明確我似乎找不到我做錯(cuò)了什么，希望有人能幫助我！

查看完整描述

3 回答

素胚勾勒不出你

TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超9個(gè)贊

您可以使用字典以有組織的方式進(jìn)行聚合。

df = pd.DataFrame([[123, 30, 20, 2],

[123, np.nan, 10, np.nan],

[124, 50, 25, 3],

[124, np.nan, 15, np.nan],

[124, np.nan, 10, np.nan]],

columns=['id', 'purchase_amount', 'price_products', 'num_products']

)

agg_dict = {

'purchase_amount': [np.sum, np.mean],

'num_products': [np.count_nonzero],

'price_products': [np.count_nonzero, np.mean],

}

print(df.groupby('id').agg(agg_dict))

輸出：

purchase_amount num_products price_products

sum mean count_nonzero count_nonzero mean

id

123 30.0 30.0 2.0 2 15.000000

124 50.0 50.0 3.0 3 16.666667

反對(duì) 回復(fù) 2023-05-09

慕的地6264312

TA貢獻(xiàn)1817條經(jīng)驗(yàn) 獲得超6個(gè)贊

由于您有多個(gè)變量要聚合，我建議使用以下聚合形式：

df.groupby('id')[<variables-list>].agg([<statistics-list>])

例如：

df_agg = df.groupby('id')[['purchase_amount','price_products','#_products']].agg(["count", "mean", "sum"])

這將創(chuàng)建一個(gè)列式多級(jí)輸出數(shù)據(jù)框，df_agg如下所示：

purchase_amount price_products #_products

count mean sum count mean sum count mean sum

id

123 1 30.0 30.0 2 15 30 1 2.0 2.0

124 1 50.0 50.0 3 17 51 1 3.0 3.0

然后，您可以使用多索引引用輸出數(shù)據(jù)框中的特定條目，如下所示：

df_agg['purchase_amount']['mean']

id

123 30.0

124 50.0

Name: mean, dtype: float64

或者，如果您想要所有方法，請(qǐng)使用橫截面方法xs()：

df_agg.xs('mean', axis=1, level=1)

purchase_amount price_products #_products

id

123 30.0 15 2.0

124 50.0 17 3.0

注意：據(jù)推測(cè)，上面的代碼會(huì)使 Python 計(jì)算比需要更多的統(tǒng)計(jì)信息，就像您的示例中的情況一樣。但這在某些情況下可能不是問(wèn)題，并且它的優(yōu)點(diǎn)是代碼更短并且可以泛化到要聚合的任何集合和數(shù)量的（數(shù)字和浮點(diǎn)數(shù)）變量。

反對(duì) 回復(fù) 2023-05-09

米琪卡哇伊

TA貢獻(xiàn)1998條經(jīng)驗(yàn) 獲得超6個(gè)贊

對(duì)所有計(jì)算都這樣做

df.groupby('id')['purchase_amount'].agg({'total_purchase_amount':'sum'})

反對(duì) 回復(fù) 2023-05-09

3 回答
0 關(guān)注
206 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

Python groupby 嵌套字典在聚合中存在歧義

Python groupby 嵌套字典在聚合中存在歧義

3 回答

添加回答