第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

對(duì)具有相同時(shí)間戳的時(shí)間序列進(jìn)行分組

對(duì)具有相同時(shí)間戳的時(shí)間序列進(jìn)行分組

繁花如伊 2023-02-07 13:55:29
對(duì) Pandas 相當(dāng)陌生,并開始掌握這個(gè)概念。希望你能給我指明正確的方向。我是以下結(jié)構(gòu)的測(cè)量溫度值的數(shù)據(jù)集。該數(shù)據(jù)集大約有 1-2 百萬個(gè)條目。由于某些傳感器在某個(gè)時(shí)候出現(xiàn)故障,因此我存在相當(dāng)多的缺失數(shù)據(jù)。                          location  temperaturetimestamp                                      2019-08-22 21:28:56         Garage        23.542019-08-22 21:29:44        bedroom        23.332019-08-23 22:21:06       outside1        25.002019-08-23 22:21:33       outside2        24.122019-08-22 21:29:53         Garage        23.40[...]我想做的是以這樣一種方式重新采樣數(shù)據(jù)集,即各個(gè)傳感器的時(shí)間戳排成一行。具體來說,我希望能夠計(jì)算各種傳感器的均值/差異。我怎樣才能做到這一點(diǎn)?總的來說,我不確定表示此類數(shù)據(jù)以使其易于使用的最佳方法是什么。我知道創(chuàng)建組,這已經(jīng)是一個(gè)很好的開始。但我仍然不知道如何以簡(jiǎn)單的方式在傳感器之間創(chuàng)建這些計(jì)算。任何幫助將不勝感激。謝謝!
查看完整描述

1 回答

?
湖上湖

TA貢獻(xiàn)2003條經(jīng)驗(yàn) 獲得超2個(gè)贊

我認(rèn)為最好的方法是首先旋轉(zhuǎn)數(shù)據(jù)框,這樣每個(gè)傳感器都有一個(gè)時(shí)間序列列:


df.pivot(columns="location", values="temperature")                                                                                        


location             Garage  bedroom  outside1  outside2

timestamp                                               

2019-08-22 21:28:56   23.54      NaN       NaN       NaN

2019-08-22 21:29:44     NaN    23.33       NaN       NaN

2019-08-22 21:29:53   23.40      NaN       NaN       NaN

2019-08-23 22:21:06     NaN      NaN      25.0       NaN

2019-08-23 22:21:33     NaN      NaN       NaN     24.12

然后你可以用插值法填充缺失的數(shù)據(jù)


df.pivot(columns="location", values="temperature").interpolate(method="time", limit_direction="both")                                     


location                Garage  bedroom  outside1  outside2

timestamp                                                  

2019-08-22 21:28:56  23.540000    23.33      25.0     24.12

2019-08-22 21:29:44  23.422105    23.33      25.0     24.12

2019-08-22 21:29:53  23.400000    23.33      25.0     24.12

2019-08-23 22:21:06  23.400000    23.33      25.0     24.12

2019-08-23 22:21:33  23.400000    23.33      25.0     24.12

現(xiàn)在你應(yīng)該讓所有數(shù)據(jù)點(diǎn)在時(shí)間上對(duì)齊,你可以重新采樣到一個(gè)恒定的采樣率,比方說“1 分鐘”


df.pivot(columns="location", values="temperature").interpolate(method="time", limit_direction="both").resample("1 min").mean()            


location                Garage  bedroom  outside1  outside2

timestamp                                                  

2019-08-22 21:28:00  23.540000    23.33      25.0     24.12

2019-08-22 21:29:00  23.411053    23.33      25.0     24.12

2019-08-22 21:30:00        NaN      NaN       NaN       NaN

2019-08-22 21:31:00        NaN      NaN       NaN       NaN

2019-08-22 21:32:00        NaN      NaN       NaN       NaN

...                        ...      ...       ...       ...

2019-08-23 22:17:00        NaN      NaN       NaN       NaN

2019-08-23 22:18:00        NaN      NaN       NaN       NaN

2019-08-23 22:19:00        NaN      NaN       NaN       NaN

2019-08-23 22:20:00        NaN      NaN       NaN       NaN

2019-08-23 22:21:00  23.400000    23.33      25.0     24.12

你顯然有很多丟失的數(shù)據(jù),采樣間隔這么小,數(shù)據(jù)點(diǎn)稀疏,我猜你的實(shí)際數(shù)據(jù)集中有更多(理想情況下,你希望在每個(gè)重采樣間隔中至少有一個(gè)數(shù)據(jù)點(diǎn))。


現(xiàn)在由您和您的實(shí)際數(shù)據(jù)決定如何進(jìn)行。.nearest()您可以使用而不是填充缺失的數(shù)據(jù).mean()。如果缺少的項(xiàng)目只是少數(shù),您可以用滾動(dòng)平均值填充它們。


查看完整回答
反對(duì) 回復(fù) 2023-02-07
  • 1 回答
  • 0 關(guān)注
  • 116 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)