1 回答

TA貢獻(xiàn)1788條經(jīng)驗(yàn) 獲得超4個(gè)贊
您正在尋找的術(shù)語(yǔ)是交叉驗(yàn)證。基本思想很簡(jiǎn)單:將數(shù)據(jù)集分成訓(xùn)練集和驗(yàn)證(或測(cè)試)集。然后,您在訓(xùn)練集上訓(xùn)練模型并在驗(yàn)證集上測(cè)試它。如果您的模型過(guò)度擬合,它將在訓(xùn)練集上表現(xiàn)良好,但在驗(yàn)證集上表現(xiàn)不佳。在這種情況下,最好降低模型復(fù)雜性或添加所謂的正則化(例如樹(shù)修剪)。
注 1:在某些情況下(例如在神經(jīng)網(wǎng)絡(luò)中),同時(shí)存在驗(yàn)證集和測(cè)試集(除了訓(xùn)練集之外)。我不會(huì)在這里詳細(xì)介紹,但請(qǐng)不要與不同上下文中的這些術(shù)語(yǔ)相混淆。
注2:交叉驗(yàn)證是一個(gè)非常標(biāo)準(zhǔn)的事情,它甚至給另一個(gè)StackExchange站點(diǎn)起了一個(gè)名字——Cross?Validated,在這里你可以得到更多關(guān)于統(tǒng)計(jì)數(shù)據(jù)的答案。另一個(gè)也許更合適的網(wǎng)站有一個(gè)不言自明的名稱(chēng)——數(shù)據(jù)科學(xué)。
添加回答
舉報(bào)