我正在嘗試預(yù)處理一些數(shù)據(jù)以用于機(jī)器學(xué)習(xí)目的。我目前正在嘗試清理一些 NaN 值,并將它們替換為“未知”和基于列名稱的前綴或后綴。原因是當(dāng)我使用一種熱編碼時(shí),我不能將多個(gè)具有相同名稱的列輸入到 xgboost 中。所以我有以下內(nèi)容df = df.apply(lambda x: x.replace(np.nan, 'unknown'))我想用“unknown_columname”替換 df 中 NaN 的所有實(shí)例。有沒有簡單或簡單的方法可以做到這一點(diǎn)?
Pandas - 替換缺失值并同時(shí)根據(jù)列添加前綴或后綴?
喵喵時(shí)光機(jī)
2023-07-27 16:19:55