首頁(yè) 猿問如何將一列中的微秒轉(zhuǎn)換為毫秒，并在...

如何將一列中的微秒轉(zhuǎn)換為毫秒，并在熊貓中將另一列的聚合模式轉(zhuǎn)換為毫秒

Python

一只斗牛犬 2023-04-25 15:21:19

我有一個(gè)包含 2 列的 df。一個(gè)是以微秒為單位的時(shí)間戳，另一個(gè)是一個(gè)值。它看起來像這樣： time score 83620 4 83621 4 83622 4 83623 4 83624 4 83625 4 83626 4 83627 4 83628 4 83629 4 83630 4 83631 4 83632 4 83633 5 83634 5 83635 5 83636 5 83637 5 83638 5 83639 6 83640 1 83641 1 83642 4我想將 df.time 協(xié)調(diào)到毫秒并按模式聚合 df.score。它應(yīng)該是這樣的： time score 8362 4 8363 5 8364 1

查看完整描述

3 回答

天涯盡頭無女友

TA貢獻(xiàn)1831條經(jīng)驗(yàn) 獲得超9個(gè)贊

嘗試：

df.groupby(df['time'] // 10)['score'].apply(lambda x: x.mode()[0])

輸出：

time

8362 4

8363 5

8364 1

Name: score, dtype: int64

反對(duì) 回復(fù) 2023-04-25

Smart貓小萌

TA貢獻(xiàn)1911條經(jīng)驗(yàn) 獲得超7個(gè)贊

首先，轉(zhuǎn)換時(shí)間列，使其包含毫秒。1 微秒包含 0.001 毫秒。因此，此代碼會(huì)將您的時(shí)間列轉(zhuǎn)換為毫秒：

df['time'] = df['time'] / 1000

然后，按所需的列分組，在本例中為分?jǐn)?shù)，然后指定您是按模式聚合的時(shí)間列。這可以使用以下代碼完成：

df.groupby(['score']).apply(pd.DataFrame.mode).reset_index(drop=True)

反對(duì) 回復(fù) 2023-04-25

萬千封印

TA貢獻(xiàn)1891條經(jīng)驗(yàn) 獲得超3個(gè)贊

兩種方法：

使用resample，不過今天才知道，目前還沒有嘗試過，不過看起來很強(qiáng)大。?
我最喜歡的方法是：

df["milliseconds"]?=?np.round(df["time"]?/?1000,?0)?#?For?cutoff,?consider?//?1000
df?=?df.groupby("milliseconds").agg(score=("score",?"mode")).reset_index()

如果時(shí)間緊迫，請(qǐng)考慮使用 .apply() 或列表理解進(jìn)行毫秒計(jì)算。如果您使用 apply 執(zhí)行此操作，請(qǐng)記住 lambda 函數(shù)有開銷。對(duì)于非常大的樣本，numpy 可能會(huì)稍微快一些。重新采樣可能比分組更快，但這很容易。

反對(duì) 回復(fù) 2023-04-25