我正在嘗試創(chuàng)建一個對pandas. 我希望可以選擇根據(jù)我發(fā)送的數(shù)據(jù)類型指定發(fā)生的聚合類型(即對于某些數(shù)據(jù),取每個 bin 的總和是合適的,而對于其他數(shù)據(jù),需要取平均值, ETC。)。例如像這樣的數(shù)據(jù):import pandas as pdimport numpy as npdr = pd.date_range('01-01-2020', '01-03-2020', freq='1H')df = pd.DataFrame(np.random.rand(len(dr)), index=dr)我可以有這樣的功能:def process(df, freq='3H', method='sum'): r = df.resample(freq) if method == 'sum': r = r.sum() elif method == 'mean': r = r.mean() #... #more options #... return r對于少量的聚合方法,這很好,但如果我想從所有可能的選項中進行選擇,這似乎很乏味。我希望用它getattr來實現(xiàn)類似這篇文章的東西(在“讓它發(fā)揮作用:泛化方法調(diào)用”下)。但是,我找不到這樣做的方法:def process2(df, freq='3H', method='sum'): r = df.resample(freq) foo = getattr(r, method) return r.foo()#fails with:#AttributeError: 'DatetimeIndexResampler' object has no attribute 'foo'def process3(df, freq='3H', method='sum'): r = df.resample(freq) foo = getattr(r, method) return foo(r)#fails with:#TypeError: __init__() missing 1 required positional argument: 'obj'我明白為什么process2會失?。ㄕ{(diào)用r.foo()查找方法foo(),r而不是變量foo)。但我不認為我明白為什么process3會失敗。我知道另一種方法是將函數(shù)傳遞給參數(shù)method,然后將apply這些函數(shù)傳遞給r. 我的傾向是這會降低效率嗎?而且它仍然不允許我直接訪問內(nèi)置的 Resample 方法。有沒有一種更簡潔的工作方式來實現(xiàn)這一目標?謝謝!
1 回答

不負相思意
TA貢獻1777條經(jīng)驗 獲得超10個贊
嘗試.resample().apply(method)
但是除非您計劃在函數(shù)內(nèi)部進行更多計算,否則硬編碼這一行可能會更容易。
添加回答
舉報
0/150
提交
取消