首頁猿問 Python：值轉換為列和標志

Python：值轉換為列和標志

Python

慕容708150 2023-05-23 10:39:21

是否有任何方法可以使用 python 代碼將值轉換為列名并將它們標記為 1 或 0，如下面的示例所示？hobbytable 在愛好列中有值，但有些單元格有多個值，用“/”分隔。為了使用多元回歸模型或其他模型，數(shù)據(jù)集的形狀會更好，低于預期結果。共享示例代碼以解決此問題將不勝感激。愛好表（CSV 文件）personID, hobbyx1234, baseball/soccery1234, reading/baseballz1234, nulla1234, soccer作為 DataFrame 的預期結果personID, baseball, soccer, reading, soccerx1234, 1, 1, 0, 0y1234, 1, 0, 1, 0z1234, 0, 0, 0, 0a1234, 0, 1, 0, 0

查看完整描述

3 回答

胡子哥哥

TA貢獻1825條經驗獲得超6個贊

你可以試試這個：

import pandas as pd

df1 = pd.read_csv(fileName, sep=",")

df2 = df1["hobby"].str.get_dummies("/")

df = pd.concat([df1, df2], axis = 1)

print(df)

輸出：

personID hobby baseball reading soccer

0 x1234 baseball/soccer 1 0 1

1 y1234 reading/baseball 1 1 0

2 z1234 NaN 0 0 0

3 a1234 soccer 0 0 1

反對回復 2023-05-23

米琪卡哇伊

TA貢獻1998條經驗獲得超6個贊

讓我們嘗試pandas.get_dummies標記值和groupby索引以減少數(shù)據(jù)幀。使用列索引連接pandas.concat創(chuàng)建。dummiesoriginal dataframe

import pandas as pd

dummies = (

? ? pd.get_dummies(df.hoppy.str.split("/").explode())

? ? ? ? .groupby(level=0).sum()

)

print(pd.concat([df, dummies], axis = 1))

personID? ? ? ? ? ? ?hoppy? baseball? reading? soccer

0? ? x1234? ?baseball/soccer? ? ? ? ?1? ? ? ? 0? ? ? ?1

1? ? y1234? reading/baseball? ? ? ? ?1? ? ? ? 1? ? ? ?0

2? ? z1234? ? ? ? ? ? ? ?NaN? ? ? ? ?0? ? ? ? 0? ? ? ?0

3? ? a1234? ? ? ? ? ? soccer? ? ? ? ?0? ? ? ? 0? ? ? ?1

反對回復 2023-05-23

猛跑小豬

TA貢獻1858條經驗獲得超8個贊

您可以一行完成：

df = df.assign(val=1).pivot_table(values='val', index='personID,', columns='hoppy').fillna(0)

解釋：

.assign()添加一列，這里我們用你稍后在輸出表中看到的 1 填充它

.pivot_table()現(xiàn)在旋轉表 essentialy 為您完成主要工作，如果找不到列的 persionID，它將具有“nan”值

.fillna()因此用于用 0 填充此“nan”值

反對回復 2023-05-23

3 回答
0 關注
231 瀏覽

關注

添加回答

舉報

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

Python：值轉換為列和標志

Python：值轉換為列和標志

3 回答

添加回答