我有一個龐大的數(shù)據(jù)集,其中混合了數(shù)值變量和分類變量。我遇到過各種特征選擇技術(shù),主要關(guān)注數(shù)字或分類數(shù)據(jù),而不是它們的混合。是否有任何特征選擇技術(shù)適用于這樣的數(shù)據(jù)集?
1 回答

慕妹3242003
TA貢獻(xiàn)1824條經(jīng)驗(yàn) 獲得超6個贊
您正在尋找 Boruta 包,它最初是用 R 編寫的,但也可以在 python 中使用。Boruta 使用隨機(jī)森林對特征進(jìn)行排名,但您首先必須處理特征中的所有缺失值,否則 boruta 會引發(fā)錯誤。在這里查看更多信息:
https://datascience.stackexchange.com/questions/31112/boruta-feature-selection-package
添加回答
舉報
0/150
提交
取消