我有一個(gè)如下所示的數(shù)據(jù)框(下面給出了 R 和 Python 數(shù)據(jù)框代碼)df = pd.DataFrame({'person_id': [11,11,11,12,12,12,12,13,13,13,13,13,14,14,14]})
df['enc_id'] = [1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579]
person_id <- c(11,11,11,12,12,12,12,13,13,13,13,13,14,14,14)
enc_id <- c(1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579)
df <- data.frame(person_id, enc_id)我想enc_id為每個(gè)人連接一個(gè)序列號(hào)我用Python寫了類似下面的東西df['new_enc_id'] = df['enc_id'].map(str) + (df.groupby('person_id').cumcount()+1).map(str)你能幫我解決以下問(wèn)題嗎?我怎樣才能在 R 中做到這一點(diǎn)?有什么優(yōu)雅的方法可以在Python中做到這一點(diǎn)嗎?我希望我的輸出如下所示。您可以看到sequence number每個(gè)組 和 都是串聯(lián)的not added。
4 回答

躍然一笑
TA貢獻(xiàn)1826條經(jīng)驗(yàn) 獲得超6個(gè)贊
您的解決方案很好,只有我用于astype
轉(zhuǎn)換為字符串:
df['new_enc_id'] = (df['enc_id'].astype(str) + (df.groupby('person_id').cumcount()+1).astype(str))

達(dá)令說(shuō)
TA貢獻(xiàn)1821條經(jīng)驗(yàn) 獲得超6個(gè)贊
在R中
df = df %>% group_by(person_id) %>% dplyr::mutate(new_enc_id = paste0(enc_id,row_number()) )

SMILET
TA貢獻(xiàn)1796條經(jīng)驗(yàn) 獲得超4個(gè)贊
在空間內(nèi)R
,您可以通過(guò)以下方式獲得相同的結(jié)果data.table
:
setDT(df) df[,?paste0(enc_id,row.names(.SD)),?by=person_id]

梵蒂岡之花
TA貢獻(xiàn)1900條經(jīng)驗(yàn) 獲得超5個(gè)贊
transform使用+的基本 R 選項(xiàng)ave
df <- transform(
df,
new_enc_id = paste0(new_enc_id, ave(1:nrow(df), person_id, FUN = seq_along))
)
添加回答
舉報(bào)
0/150
提交
取消