第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

Python groupby 嵌套字典在聚合中存在歧義

Python groupby 嵌套字典在聚合中存在歧義

繁星淼淼 2023-05-09 10:53:00
我目前正在研究我的論文,并且在我想做的 groupby 函數(shù)中面臨一些問題。我想找出某人的總購(gòu)買量、平均購(gòu)買量、購(gòu)買次數(shù)、總共購(gòu)買了多少產(chǎn)品以及每件產(chǎn)品的平均價(jià)值。數(shù)據(jù)看起來像這樣:    id  purchase_amount price_products  #_products0   123 30              20.00           22   123 NaN             10.00           NaN3   124 50.00           25.00           34   124 NaN             15.00           NaN5   124 NaN             10.00           NaN我的代碼如下所示:df.groupby('id')[['purchase_amount','price_products','#_products']].agg(total_purchase_amount=('purchase_amount','sum'),average_purchase_amount=('purchase_amount','mean'),times_purchased=('#_products','count'),total_amount_products_purchased=('price_products','count'),average_value_products=('price_products','mean'))但我收到以下錯(cuò)誤:SpecificationError:嵌套字典在聚合中不明確我似乎找不到我做錯(cuò)了什么,希望有人能幫助我!
查看完整描述

3 回答

?
素胚勾勒不出你

TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超9個(gè)贊

您可以使用字典以有組織的方式進(jìn)行聚合。


df = pd.DataFrame([[123, 30, 20, 2],

                   [123, np.nan, 10, np.nan],

                   [124, 50, 25, 3],

                   [124, np.nan, 15, np.nan],

                   [124, np.nan, 10, np.nan]],

                  columns=['id', 'purchase_amount', 'price_products', 'num_products']

                  )


agg_dict = {

    'purchase_amount': [np.sum, np.mean],

    'num_products': [np.count_nonzero],

    'price_products': [np.count_nonzero, np.mean],

}


print(df.groupby('id').agg(agg_dict))

輸出:


    purchase_amount        num_products price_products           

                sum  mean count_nonzero  count_nonzero       mean

id                                                               

123            30.0  30.0           2.0              2  15.000000

124            50.0  50.0           3.0              3  16.666667


查看完整回答
反對(duì) 回復(fù) 2023-05-09
?
慕的地6264312

TA貢獻(xiàn)1817條經(jīng)驗(yàn) 獲得超6個(gè)贊

由于您有多個(gè)變量要聚合,我建議使用以下聚合形式:


df.groupby('id')[<variables-list>].agg([<statistics-list>])


例如:


df_agg = df.groupby('id')[['purchase_amount','price_products','#_products']].agg(["count", "mean", "sum"])


這將創(chuàng)建一個(gè)列式多級(jí)輸出數(shù)據(jù)框,df_agg如下所示:


    purchase_amount             price_products          #_products          

              count  mean   sum          count mean sum      count mean  sum

id                                                                          

123               1  30.0  30.0              2   15  30          1  2.0  2.0

124               1  50.0  50.0              3   17  51          1  3.0  3.0

然后,您可以使用多索引引用輸出數(shù)據(jù)框中的特定條目,如下所示:


df_agg['purchase_amount']['mean']


id

123    30.0

124    50.0

Name: mean, dtype: float64

或者,如果您想要所有方法,請(qǐng)使用橫截面方法xs():


df_agg.xs('mean', axis=1, level=1)


     purchase_amount  price_products  #_products

id                                              

123             30.0              15         2.0

124             50.0              17         3.0

注意:據(jù)推測(cè),上面的代碼會(huì)使 Python 計(jì)算比需要更多的統(tǒng)計(jì)信息,就像您的示例中的情況一樣。但這在某些情況下可能不是問題,并且它的優(yōu)點(diǎn)是代碼更短并且可以泛化到要聚合的任何集合和數(shù)量的(數(shù)字和浮點(diǎn)數(shù))變量。


查看完整回答
反對(duì) 回復(fù) 2023-05-09
?
米琪卡哇伊

TA貢獻(xiàn)1998條經(jīng)驗(yàn) 獲得超6個(gè)贊

對(duì)所有計(jì)算都這樣做

df.groupby('id')['purchase_amount'].agg({'total_purchase_amount':'sum'})


查看完整回答
反對(duì) 回復(fù) 2023-05-09
  • 3 回答
  • 0 關(guān)注
  • 180 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)