我有兩個(gè)數(shù)據(jù)框,每個(gè)數(shù)據(jù)框都具有相同的變量和行長度,但是分類變量(對(duì)象列)有時(shí)在一個(gè)與另一個(gè)中具有不同的實(shí)現(xiàn)。這就是我的意思。Frame 1 | categorical_1 | categorical_2 ||| Frame 2 | categorical_1 | categorical_2row 1 | blue | flakes ||| row 1 | blue | flakesrow 2 | red | cheerios ||| row 2 | red | flakesrow 3 | blue | cheerios ||| row 3 | green | flakes正如您在上面的基本插圖中所見,綠色僅出現(xiàn)在第二個(gè)數(shù)據(jù)框中,而cheerios 僅出現(xiàn)在我的第一個(gè)數(shù)據(jù)框中?;旧?,我需要一種方法來考慮兩個(gè)數(shù)據(jù)幀(或更多)的“變量范圍”來創(chuàng)建虛擬變量列,所以我不能只調(diào)用pd.get_dummies它們中的任何一個(gè)。
1 回答

素胚勾勒不出你
TA貢獻(xiàn)1827條經(jīng)驗(yàn) 獲得超9個(gè)贊
pandas 中沒有其他功能可以幫助您做到這一點(diǎn)。正如您所提到的,pd.get_dummies
只能在一個(gè)數(shù)據(jù)框中創(chuàng)建虛擬對(duì)象。
您的數(shù)據(jù)框中是否有索引或不同的 ID?
如果你這樣做,你可以categorical_2
將它們合并到一個(gè)數(shù)據(jù)幀中。然后您可以使用pd.get_dummies
并最終根據(jù)不同的索引或 ID 將其匹配回原始數(shù)據(jù)幀。
如果你不這樣做,我認(rèn)為處理這個(gè)問題的唯一方法是手動(dòng)編碼。
添加回答
舉報(bào)
0/150
提交
取消