3 回答

TA貢獻(xiàn)1803條經(jīng)驗(yàn) 獲得超6個(gè)贊
假設(shè)您在訓(xùn)練集中訓(xùn)練模型,然后在測(cè)試集中測(cè)量模型的性能。您認(rèn)為仍有改進(jìn)的空間,請(qǐng)嘗試調(diào)整超參數(shù)(如果模型是神經(jīng)網(wǎng)絡(luò)-超參數(shù)是層數(shù)或?qū)又械墓?jié)點(diǎn))?,F(xiàn)在,您可以獲得更好的性能。但是,當(dāng)模型接受其他數(shù)據(jù)(不在測(cè)試和訓(xùn)練集中)時(shí),您可能無法獲得相同水平的準(zhǔn)確性。這是因?yàn)槟谡{(diào)整超參數(shù)時(shí)引入了一些偏差,以在測(cè)試集上獲得更好的精度。您基本上已經(jīng)對(duì)模型和超參數(shù)進(jìn)行了調(diào)整,以針對(duì)該特定訓(xùn)練集生成最佳模型。
常見的解決方案是進(jìn)一步拆分訓(xùn)練集以創(chuàng)建驗(yàn)證集?,F(xiàn)在你有
訓(xùn)練集
測(cè)試裝置
驗(yàn)證集
您可以像以前一樣進(jìn)行操作,但是這次使用驗(yàn)證集測(cè)試性能并調(diào)整超參數(shù)。更具體地說,您可以在簡(jiǎn)化的訓(xùn)練集上(即完整的訓(xùn)練集減去驗(yàn)證集)訓(xùn)練具有各種超參數(shù)的多個(gè)模型,然后選擇在驗(yàn)證集上表現(xiàn)最佳的模型。
在驗(yàn)證集上選擇性能最佳的模型后,即可在完整的訓(xùn)練集(包括驗(yàn)證集)上訓(xùn)練最佳模型,這將為您提供最終模型。
最后,您在測(cè)試集上評(píng)估此最終模型,以獲得對(duì)泛化誤差的估計(jì)。
- 3 回答
- 0 關(guān)注
- 3915 瀏覽
添加回答
舉報(bào)