如何利用樣本函數(shù)將數(shù)據(jù)分割成訓練/測試集我剛剛開始使用R,我不知道如何將數(shù)據(jù)集與以下示例代碼合并:sample(x, size, replace = FALSE, prob = NULL)我有一個數(shù)據(jù)集,我需要投入培訓(75%)和測試(25%)集。我不知道我應該把什么信息放進x和尺碼里?x是數(shù)據(jù)集文件嗎?我有多少個樣本?
3 回答

ITMISS
TA貢獻1871條經(jīng)驗 獲得超8個贊
有許多實現(xiàn)數(shù)據(jù)分區(qū)的方法。要獲得更完整的方法,請查看createDataPartition函數(shù)中的caret包裹。
下面是一個簡單的例子:
data(mtcars)
## 75% of the sample size
smp_size <- floor(0.75 * nrow(mtcars))
## set the seed to make your partition reproducible
set.seed(123)
train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)
train <- mtcars[train_ind, ]
test <- mtcars[-train_ind, ]
- 3 回答
- 0 關(guān)注
- 876 瀏覽
添加回答
舉報
0/150
提交
取消