在Scikit中跨多個列進行標簽編碼-學習我在試著用LabelEncoder為熊貓編碼DataFrame字符串標簽。由于dataframe有許多(50+)列,所以我希望避免創(chuàng)建LabelEncoder對象;我寧愿只有一個大的LabelEncoder跨部門工作的對象。全我的數(shù)據(jù)列。把整個DataFrame進LabelEncoder創(chuàng)建以下錯誤。請記住,我在這里使用的是虛擬數(shù)據(jù);實際上,我處理的是大約50列帶有字符串標簽的數(shù)據(jù),因此需要一個不按名稱引用任何列的解決方案。import pandasfrom sklearn import preprocessing
df = pandas.DataFrame({
'pets': ['cat', 'dog', 'cat', 'monkey', 'dog', 'dog'],
'owner': ['Champ', 'Ron', 'Brick', 'Champ', 'Veronica', 'Ron'],
'location': ['San_Diego', 'New_York', 'New_York', 'San_Diego', 'San_Diego',
'New_York']})le = preprocessing.LabelEncoder()le.fit(df)追溯(最近一次調用):文件“,第1行,在文件”/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/preprocessing/label.py“,第103行,在FIT y=列_或_1D(y,WARN=True)文件”/Users/bbalin/anaconda/lib/python2.7/site-packages/sklearn/utils/validation.py“,行306中,在列_或_1D中提高ValueError(”壞輸入形狀{0}“。格式(形狀)值錯誤:輸入形狀錯誤(6,3)對如何解決這個問題有什么想法嗎?
在Scikit中跨多個列進行標簽編碼-學習
慕田峪4524236
2019-07-26 15:14:57