第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

搜索優(yōu)化.

搜索優(yōu)化.

四季花海 2023-07-27 10:10:13
我正在處理一個(gè)問題陳述,其中有兩個(gè)數(shù)據(jù)幀 df1 和 df_main。df_main如下:users = ['id1','id1','id2','id2','id3','id3','id4']keywords = ['k1','k1', 'k2','k2','k2','k3','k3']quantity = [10,10,2,2,2,4,4]duration  = [1,1,3,3,3,2,2]df_main = pd.DataFrame(list(zip(users, keywords, quantity, duration)), columns = ['users','keywords','quantity','duration'])df_main 基本上是一個(gè)包含 user_id 信息、相應(yīng)關(guān)鍵字以及數(shù)量和持續(xù)時(shí)間列的數(shù)據(jù)框df1 有一列用于 user_id,其余列用于 df_main 中的所有關(guān)鍵字。使用 main_df 作為參考,每個(gè) user_id 和關(guān)鍵字對都標(biāo)記為 1,否則保留為 0。這是 df1 的代碼:columns = ['USER_ID','k1','k2','k3']users = ['id1','id2','id3','id4']values1 = [1,0,0,0]values2 = [0,1,1,0]values3 = [0,0,1,1]df1 = pd.DataFrame(list(zip(users, values1, values2, values3)), columns = columns)現(xiàn)在我想要以下數(shù)據(jù)框:其中total_quantity和total_duration是每個(gè)id和關(guān)鍵字對的數(shù)量和持續(xù)時(shí)間值的總和。該代碼正在運(yùn)行,但它真的很慢,我真的想擺脫循環(huán)。如果有人能向我展示一種更優(yōu)化的方法,我將不勝感激。
查看完整描述

1 回答

?
萬千封印

TA貢獻(xiàn)1891條經(jīng)驗(yàn) 獲得超3個(gè)贊

代碼中性能的主要問題是多個(gè)循環(huán)。您可以使用 pandas 內(nèi)置方法將所有循環(huán)委托給 numpy 的 C 實(shí)現(xiàn)。


例如,使用df_main.groupbysum、重塑和展平索引...然后與 合并df1。


df_temp = df_main.groupby(['users', 'keywords']).sum().unstack()

df_temp.columns = 'total_' + df_temp.columns.map('_'.join) # flatten column index


df1 = df1.merge(df_temp, left_on='USER_ID', right_on='users')

輸出


       total_quantity_k1  total_quantity_k2  total_quantity_k3  \

users

id1                 20.0                NaN                NaN

id2                  NaN                4.0                NaN

id3                  NaN                2.0                4.0

id4                  NaN                NaN                4.0


       total_duration_k1  total_duration_k2  total_duration_k3

users

id1                  2.0                NaN                NaN

id2                  NaN                6.0                NaN

id3                  NaN                3.0                2.0

id4                  NaN                NaN                2.0

  USER_ID  k1  k2  k3  total_quantity_k1  total_quantity_k2  \

0     id1   1   0   0               20.0                NaN

1     id2   0   1   0                NaN                4.0

2     id3   0   1   1                NaN                2.0

3     id4   0   0   1                NaN                NaN


   total_quantity_k3  total_duration_k1  total_duration_k2  total_duration_k3

0                NaN                2.0                NaN                NaN

1                NaN                NaN                6.0                NaN

2                4.0                NaN                3.0                2.0

3                4.0                NaN                NaN                2.0


查看完整回答
反對 回復(fù) 2023-07-27
  • 1 回答
  • 0 關(guān)注
  • 110 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)