首頁猿問對(duì)具有相同時(shí)間戳的時(shí)間序列進(jìn)行分組

對(duì)具有相同時(shí)間戳的時(shí)間序列進(jìn)行分組

Python

繁花如伊 2023-02-07 13:55:29

對(duì) Pandas 相當(dāng)陌生，并開始掌握這個(gè)概念。希望你能給我指明正確的方向。我是以下結(jié)構(gòu)的測(cè)量溫度值的數(shù)據(jù)集。該數(shù)據(jù)集大約有 1-2 百萬個(gè)條目。由于某些傳感器在某個(gè)時(shí)候出現(xiàn)故障，因此我存在相當(dāng)多的缺失數(shù)據(jù)。 location temperaturetimestamp 2019-08-22 21:28:56 Garage 23.542019-08-22 21:29:44 bedroom 23.332019-08-23 22:21:06 outside1 25.002019-08-23 22:21:33 outside2 24.122019-08-22 21:29:53 Garage 23.40[...]我想做的是以這樣一種方式重新采樣數(shù)據(jù)集，即各個(gè)傳感器的時(shí)間戳排成一行。具體來說，我希望能夠計(jì)算各種傳感器的均值/差異。我怎樣才能做到這一點(diǎn)？總的來說，我不確定表示此類數(shù)據(jù)以使其易于使用的最佳方法是什么。我知道創(chuàng)建組，這已經(jīng)是一個(gè)很好的開始。但我仍然不知道如何以簡(jiǎn)單的方式在傳感器之間創(chuàng)建這些計(jì)算。任何幫助將不勝感激。謝謝！

查看完整描述

1 回答

湖上湖

TA貢獻(xiàn)2003條經(jīng)驗(yàn) 獲得超2個(gè)贊

我認(rèn)為最好的方法是首先旋轉(zhuǎn)數(shù)據(jù)框，這樣每個(gè)傳感器都有一個(gè)時(shí)間序列列：

df.pivot(columns="location", values="temperature")

location Garage bedroom outside1 outside2

timestamp

2019-08-22 21:28:56 23.54 NaN NaN NaN

2019-08-22 21:29:44 NaN 23.33 NaN NaN

2019-08-22 21:29:53 23.40 NaN NaN NaN

2019-08-23 22:21:06 NaN NaN 25.0 NaN

2019-08-23 22:21:33 NaN NaN NaN 24.12

然后你可以用插值法填充缺失的數(shù)據(jù)

df.pivot(columns="location", values="temperature").interpolate(method="time", limit_direction="both")

location Garage bedroom outside1 outside2

timestamp

2019-08-22 21:28:56 23.540000 23.33 25.0 24.12

2019-08-22 21:29:44 23.422105 23.33 25.0 24.12

2019-08-22 21:29:53 23.400000 23.33 25.0 24.12

2019-08-23 22:21:06 23.400000 23.33 25.0 24.12

2019-08-23 22:21:33 23.400000 23.33 25.0 24.12

現(xiàn)在你應(yīng)該讓所有數(shù)據(jù)點(diǎn)在時(shí)間上對(duì)齊，你可以重新采樣到一個(gè)恒定的采樣率，比方說“1 分鐘”

df.pivot(columns="location", values="temperature").interpolate(method="time", limit_direction="both").resample("1 min").mean()

location Garage bedroom outside1 outside2

timestamp

2019-08-22 21:28:00 23.540000 23.33 25.0 24.12

2019-08-22 21:29:00 23.411053 23.33 25.0 24.12

2019-08-22 21:30:00 NaN NaN NaN NaN

2019-08-22 21:31:00 NaN NaN NaN NaN

2019-08-22 21:32:00 NaN NaN NaN NaN

... ... ... ... ...

2019-08-23 22:17:00 NaN NaN NaN NaN

2019-08-23 22:18:00 NaN NaN NaN NaN

2019-08-23 22:19:00 NaN NaN NaN NaN

2019-08-23 22:20:00 NaN NaN NaN NaN

2019-08-23 22:21:00 23.400000 23.33 25.0 24.12

你顯然有很多丟失的數(shù)據(jù)，采樣間隔這么小，數(shù)據(jù)點(diǎn)稀疏，我猜你的實(shí)際數(shù)據(jù)集中有更多（理想情況下，你希望在每個(gè)重采樣間隔中至少有一個(gè)數(shù)據(jù)點(diǎn)）。

現(xiàn)在由您和您的實(shí)際數(shù)據(jù)決定如何進(jìn)行。.nearest()您可以使用而不是填充缺失的數(shù)據(jù).mean()。如果缺少的項(xiàng)目只是少數(shù)，您可以用滾動(dòng)平均值填充它們。

反對(duì) 回復(fù) 2023-02-07

1 回答
0 關(guān)注
116 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

對(duì)具有相同時(shí)間戳的時(shí)間序列進(jìn)行分組

對(duì)具有相同時(shí)間戳的時(shí)間序列進(jìn)行分組

1 回答

添加回答