第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

在不使用 apply 的情況下在數(shù)據(jù)幀上使用滾動(dòng)時(shí)遇到問題,這很慢

在不使用 apply 的情況下在數(shù)據(jù)幀上使用滾動(dòng)時(shí)遇到問題,這很慢

飲歌長(zhǎng)嘯 2023-10-25 10:30:19
我有一個(gè)數(shù)據(jù)框,如下所示:ID        Date        Prize     IfWon1         01-01-20      5         12         01-01-20      8         11         01-03-20      3         01         01-04-20      10        11         01-07-20      5         02         01-10-20      5         13         01-10-20      10        1我想添加一個(gè)新列,對(duì)于給定的 ID,該列將包括他們?cè)谠撊掌谥?7 天內(nèi)贏得的所有獎(jiǎng)金的總和,但不包括該日期。目標(biāo)是擁有一個(gè)如下所示的數(shù)據(jù)框:ID        Date        Prize     IfWon    PrevWon1         01-01-20      5         1         02         01-01-20      8         1         01         01-03-20      3         0         51         01-04-20      10        1         51         01-07-20      5         0         152         01-10-20      5         1         03         01-10-20      10        1         0我必須執(zhí)行的代碼如下,它可以工作,但我有兩個(gè)問題:def get_rolling_prize_sum(grp, freq):    return grp.rolling(freq, on = 'Date', closed = 'right')['CurrentWon'].sum()processed_data_df['CurrentWon'] = processed_data_df['Prize'] * processed_data_df['IfWon'] # gets deleted laterprocessed_data_df['PrevWon'] = processed_data_df.groupby('ID', group_keys=False).apply(get_rolling_prize_sum, '7D').astype(float) - processed_data_df['CurrentWon']因?yàn)槲也幌氚ó?dāng)天的獎(jiǎng)品,所以我試圖關(guān)閉右側(cè)的滾動(dòng),但這不起作用(例如,取出上面的 close = 'right' 會(huì)做完全相同的事情) 。因此,我最終在最后一行進(jìn)行了減法。我使用的實(shí)際數(shù)據(jù)庫(kù)很大,我需要在不同的點(diǎn)進(jìn)行許多滾動(dòng)求和,但它的速度非常慢。有人告訴我,我可以在不使用 .apply 的情況下直接使用 .rolling 來完成此操作,但我無法使其正常工作。我的嘗試如下,有錯(cuò)誤,我會(huì)注意到該錯(cuò)誤花了幾分鐘才產(chǎn)生,這是唯一重要的計(jì)算,所以看起來好像它正在執(zhí)行其中的一部分,然后稍后失?。? Not using closed right here, just subtractingprocessed_data_df['PrevWon'] = processed_data_df.groupby('ID', group_keys=False).rolling('7D', on = 'Date')['CurrentWon'].sum() - processed_data_df['CurrentWon']ValueError: cannot join with no overlapping index names有任何想法嗎?
查看完整描述

1 回答

?
慕碼人8056858

TA貢獻(xiàn)1803條經(jīng)驗(yàn) 獲得超6個(gè)贊

改進(jìn)了之前的答案并設(shè)法解決了 groupby 的排序問題


df = pd.read_csv("data.csv")

df["Date"] = pd.to_datetime(df['Date'], format='%m-%d-%y')

df["CurrentWon"] = df["Prize"] * df["IfWon"]


result = df.groupby("ID").rolling("7D", on = 'Date', closed = 'right').CurrentWon.sum().reset_index()

result.rename(columns={"CurrentWon": "PreviousWon"}, inplace=True)

df = df.merge(result, on=["ID", "Date"])

df["PreviousWon"] -= df["CurrentWon"]

print(df)

輸出:


   ID       Date  Prize  IfWon  CurrentWon  PreviousWon

0   1 2020-01-01      5      1           5          0.0

1   2 2020-01-01      8      1           8          0.0

2   1 2020-01-03      3      0           0          5.0

3   1 2020-01-04     10      1          10          5.0

4   1 2020-01-07      5      0           0         15.0

5   2 2020-01-10      5      1           5          0.0

6   3 2020-01-10     10      1          10          0.0


查看完整回答
反對(duì) 回復(fù) 2023-10-25
  • 1 回答
  • 0 關(guān)注
  • 128 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)