假設(shè)我有這個(gè)熊貓系列:num = pd.Series([1,2,3,4,5,6,5,6,4,2,1,3])我想做的是得到一個(gè)數(shù)字,比如說(shuō)5,并返回之前發(fā)生的索引。因此,如果我使用元素 5,我應(yīng)該得到 4,因?yàn)樵撛爻霈F(xiàn)在索引 4 和 6 中?,F(xiàn)在我想為該系列的所有元素執(zhí)行此操作,并且可以使用for循環(huán)輕松完成:for idx,x in enumerate(num): idx_prev = num[num == x].idxmax() if(idx_prev < idx): return idx_prev但是,由于循環(huán),此過(guò)程對(duì)于較長(zhǎng)的串聯(lián)長(zhǎng)度消耗了太多時(shí)間。有沒(méi)有辦法以矢量化的形式實(shí)現(xiàn)同樣的事情?輸出應(yīng)如下所示:[NaN,NaN,NaN,NaN,NaN,NaN,4,5,3,1,0,2]
2 回答

揚(yáng)帆大魚
TA貢獻(xiàn)1799條經(jīng)驗(yàn) 獲得超9個(gè)贊
您可以使用 來(lái)移動(dòng)索引:groupby
num.index.to_series().groupby(num).shift()
輸出:
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
5 NaN
6 4.0
7 5.0
8 3.0
9 1.0
10 0.0
11 2.0
dtype: float64

浮云間
TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超4個(gè)贊
可以在 中繼續(xù)工作。numpy
相當(dāng)于使用是:[num[num == x].idxmax() for idx,x in enumerate(num)]
numpy
_, out = np.unique(num.values, return_inverse=True)
哪個(gè)分配
array([0, 1, 2, 3, 4, 5, 4, 5, 3, 1, 0, 2], dtype=int64)
自?,F(xiàn)在,您可以將 的壞值分配給 s,如下所示:out
out
Nan
out_series = pd.Series(out) out_series[out >= np.arange(len(out))] = np.nan
添加回答
舉報(bào)
0/150
提交
取消