第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

根據(jù)具有時間戳的另一列中的時間間隔創(chuàng)建包含值計數(shù)的列表

根據(jù)具有時間戳的另一列中的時間間隔創(chuàng)建包含值計數(shù)的列表

BIG陽 2023-07-11 14:05:49
假設(shè)我有一個包含兩列、一個字符串和一個日期時間的 pandas 數(shù)據(jù)框,如下所示:ORDER        TIMESTAMPGO     6/4/2019 09:59:49.497000STAY   6/4/2019 09:05:27.036000WAIT   6/4/2019 10:33:05.645000GO     6/4/2019 10:28:03.649000STAY   6/4/2019 11:23:11.614000GO     6/4/2019 11:00:33.574000WAIT   6/4/2019 11:41:55.744000我想創(chuàng)建一個列表,其中每個條目都是一個包含三個值的列表。對于每個選擇的時間間隔(例如一小時),每個條目是:[開始時間、總行數(shù)、順序為 GO 的行的百分比]。例如,對于上面的數(shù)據(jù)框,我的列表是:[6/4/2019 09:00:00.000000, 2, 50][6/4/2019 10:00:00.000000, 2, 50][6/4/2019 11:00:00.000000, 3, 33.3]我創(chuàng)建了一個簡單的 while 循環(huán):go= []while t<=df["timestamp"].iloc[-1]:  tmp1 = df[(df["date_time"]>=t) & (df["timestamp"]<t+timedelta(hour=1))]  tmp2 = df[(df["date_time"]>=t) & (df["timestamp"]<t+timedelta(hour=1)) & (df["Order"]=="GO")]  go.append([t, tmp1.shape[0], 100.0*tmp2.shape[0]/tmp1.shape[0]])  #increment the time by the interval  t=t+timedelta(hour=1)然而,我的初始數(shù)據(jù)幀有數(shù)百萬行,我希望我的時間間隔比一個小時短得多,所以這種方法非常慢。更Pythonic的方法是什么?
查看完整描述

1 回答

?
小怪獸愛吃肉

TA貢獻1852條經(jīng)驗 獲得超1個贊

讓我們嘗試groupby().agg()使用size行數(shù)并mean獲取行的比率GO:


(df.ORDER.eq('GO').astype(int)

   .groupby(df.TIMESTAMP.dt.floor('1H'))   # groupby interval of choice

   .agg(['size','mean'])

   .reset_index()              # get timestamp back

   .to_numpy().tolist()        # this is to generate the list

)

輸出:


[[Timestamp('2019-06-04 09:00:00'), 2, 0.5],

 [Timestamp('2019-06-04 10:00:00'), 2, 0.5],

 [Timestamp('2019-06-04 11:00:00'), 3, 0.3333333333333333]]


查看完整回答
反對 回復(fù) 2023-07-11
  • 1 回答
  • 0 關(guān)注
  • 116 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號