嗨,我在熊貓中有一張桌子(請(qǐng)參見(jiàn)屏幕截圖以提取一部分-它有很多行),希望提取出唯一的'author_id',然后運(yùn)行一個(gè)函數(shù)以提取與每個(gè)ID相關(guān)的詳細(xì)信息。我通過(guò)以下方式提取唯一ID的列表:unique_ids = df['author_id'].unique()然后,我嘗試運(yùn)行:df['author_id'].unique().apply(some_function)其中“ some_function”采用“ author_id”并返回一些信息。但是我得到了錯(cuò)誤:AttributeError: 'numpy.ndarray' object has no attribute 'apply'因此,我訴諸于:[unique_ids中author_id的some_function(author_id)]哪個(gè)可行,但不是實(shí)現(xiàn)此目的的高效/矢量化方法。用矢量化方式進(jìn)行此操作的方式是什么?
2 回答

陪伴而非守候
TA貢獻(xiàn)1757條經(jīng)驗(yàn) 獲得超8個(gè)贊
唯一函數(shù)的輸出是一個(gè)numpy數(shù)組,它不提供apply方法。您可以Series
通過(guò)該數(shù)組創(chuàng)建一個(gè),然后應(yīng)用您的函數(shù):
pd.Series(df['author_id'].unique()).apply(some_function)

白豬掌柜的
TA貢獻(xiàn)1893條經(jīng)驗(yàn) 獲得超10個(gè)贊
我認(rèn)為您想執(zhí)行以下操作groupby:
g = df.groupby('author_id')
g.apply(some_function)
添加回答
舉報(bào)
0/150
提交
取消