3 回答

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超9個贊
這取決于您使用的算法和數(shù)據(jù)集。
支持向量機(jī)(SVM),如果您縮放功能,這些模型的收斂速度會更快??s放的主要優(yōu)點(diǎn)是避免較大數(shù)值范圍內(nèi)的屬性主導(dǎo)較小數(shù)值范圍內(nèi)的屬性
在K均值聚類中,您可以找到將不同數(shù)據(jù)點(diǎn)聚在一起的歐幾里得距離。因此,這似乎是縮放要素的一個很好的理由,以使質(zhì)心不受較大或異常值的影響很大。
在回歸的情況下,縮放特征不會有太大幫助,因?yàn)樵紨?shù)據(jù)集之間的系數(shù)關(guān)系與縮放后的數(shù)據(jù)集之間的系數(shù)關(guān)系將相同。
對于決策樹,它們通常不需要特征縮放。
在涉及學(xué)習(xí)率且使用梯度下降的模型的情況下,輸入比例會影響梯度。因此,在這種情況下將考慮特征縮放。

TA貢獻(xiàn)1776條經(jīng)驗(yàn) 獲得超12個贊
一個非常簡單的答案。即使您不這樣做,某些算法也會進(jìn)行特征縮放,而有些算法則不會。因此,如果算法不支持,則需要手動縮放要素。
您可以通過谷歌搜索哪種算法進(jìn)行特征縮放,但是通過手動縮放特征可以確保安全。始終確保對要素進(jìn)行縮放,否則算法將使輸出偏移達(dá)到理想狀態(tài)。
添加回答
舉報(bào)