第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

為什么使用 RFE 進行特征縮減后 R2 值會增加?

為什么使用 RFE 進行特征縮減后 R2 值會增加?

函數(shù)式編程 2023-07-05 10:22:21
對于一個探索性學期項目,我試圖使用生產過程中進行的各種測量來預測質量控制測量的結果值。對于該項目,我正在測試不同的算法(LinearRegression、RandomForestRegressor、GradientBoostingRegressor,...)。我通常得到相當?shù)偷?r2 值(大約 0.3),這可能是由于特征值的分散而不是我這里真正的問題。最初,我有大約 100 個特征,我試圖使用 RFE 和 LinearRegression() 作為估計器來減少這些特征。交叉驗證表明,我應該將特征減少到僅 60 個。然而,當我這樣做時,對于某些模型,R2 值會增加。這怎么可能?我的印象是,向模型添加變量總是會增加 R2,因此減少變量數(shù)量應該會導致 R2 值降低。有人可以對此發(fā)表評論或提供解釋嗎?提前致謝。
查看完整描述

1 回答

?
開滿天機

TA貢獻1786條經驗 獲得超13個贊

這取決于您是否使用testingtraining數(shù)據來測量 R2。這是衡量模型捕獲的數(shù)據方差有多大的指標。因此,如果增加預測變量的數(shù)量,那么你是正確的,因為你可以更好地準確預測訓練數(shù)據的位置,因此你的 R2 應該增加(減少預測變量的數(shù)量則相反)。

但是,如果您將預測變量的數(shù)量增加太多,則可能會overfit影響訓練數(shù)據。這意味著模型的方差實際上人為地很高,因此您對測試集的預測將開始受到影響。因此,通過減少預測變量的數(shù)量,您實際上可以更好地預測數(shù)據test set,因此您的 R2 應該會增加。


查看完整回答
反對 回復 2023-07-05
  • 1 回答
  • 0 關注
  • 147 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號