課程
/后端開發(fā)
/Python
/人工智能入門:Python實(shí)現(xiàn)機(jī)器學(xué)習(xí)
如果數(shù)據(jù)集里有很多特征,如何挑選特征放進(jìn)模型呢?全部都放進(jìn)去再看哪個(gè)有效,還是先挑選一部分?
2019-09-09
源自:人工智能入門:Python實(shí)現(xiàn)機(jī)器學(xué)習(xí) 2-5
正在回答
通常來說,如果特征本身不是很多,那可以考慮把所有的特征都放入模型,這通??赡芴岣吣愕哪P捅憩F(xiàn),缺點(diǎn)就是可能導(dǎo)致過擬合,即對(duì)新數(shù)據(jù)的預(yù)測(cè)不夠準(zhǔn)確。
從已有特征中挑選特征的方式可以考慮:1、基于經(jīng)驗(yàn),即根據(jù)主觀經(jīng)驗(yàn)挑選影響比較大的特征,比如預(yù)測(cè)疾病可能性,那年齡肯定是一個(gè)因素;2、對(duì)比有某一個(gè)特征與沒有某個(gè)特征情況下,模型的表現(xiàn),判斷該特征的重要性。
舉報(bào)
使用python手把手教你編程實(shí)現(xiàn)機(jī)器學(xué)習(xí)
2 回答python模型評(píng)估方法
2 回答模型數(shù)據(jù)準(zhǔn)確率
1 回答模型結(jié)構(gòu)打印不出來
2 回答如何聯(lián)系老師???
1 回答為什么我分離后的模型,添加新數(shù)據(jù)后的準(zhǔn)確率更高了?
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號(hào)-11 京公網(wǎng)安備11010802030151號(hào)
購課補(bǔ)貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動(dòng)學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號(hào)
2019-09-10
通常來說,如果特征本身不是很多,那可以考慮把所有的特征都放入模型,這通??赡芴岣吣愕哪P捅憩F(xiàn),缺點(diǎn)就是可能導(dǎo)致過擬合,即對(duì)新數(shù)據(jù)的預(yù)測(cè)不夠準(zhǔn)確。
從已有特征中挑選特征的方式可以考慮:1、基于經(jīng)驗(yàn),即根據(jù)主觀經(jīng)驗(yàn)挑選影響比較大的特征,比如預(yù)測(cè)疾病可能性,那年齡肯定是一個(gè)因素;2、對(duì)比有某一個(gè)特征與沒有某個(gè)特征情況下,模型的表現(xiàn),判斷該特征的重要性。