python中什么是測試數(shù)據(jù)和訓練數(shù)據(jù)
1 回答

楊__羊羊
TA貢獻1943條經(jīng)驗 獲得超7個贊
當數(shù)據(jù)量特別大的時候,有幾千幾萬條,為了驗證模型的好壞,取出一部分用于訓練,另一部分用作測試。當模型訓練好的時候,其必定是符合訓練數(shù)據(jù)的分布,為了驗證模型的泛化能力,就利用沒有參與訓練的測試集,放入模型計算出結(jié)果,和真實值比較,就可以看出回歸模型預(yù)測得準不準了
從代碼來看你這個做的是一個簡單的線性回歸模型,數(shù)據(jù)很簡單就是研發(fā)成本對應(yīng)產(chǎn)品質(zhì)量,利用線性回歸擬合一條直線,由于你的數(shù)據(jù)特別少只有8個點,所以完全沒有必要區(qū)分訓練數(shù)據(jù)和測試數(shù)據(jù),尤其你設(shè)置測試集比例為0.1,其實就只有一條,用處不大,所以沒有區(qū)分的必要
- 1 回答
- 0 關(guān)注
- 1162 瀏覽
添加回答
舉報
0/150
提交
取消