第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

如何確保來自特定組的所有樣本在 sklearn cross_val_predict

如何確保來自特定組的所有樣本在 sklearn cross_val_predict

Go
元芳怎么了 2023-01-04 10:10:50
我有一個(gè)數(shù)據(jù)框,其中每個(gè)樣本都屬于一個(gè)組。例如:df = a b c group     1 1 2  G1     1 6 1  G1     8 2 8  G3     2 8 7  G2     1 9 2  G2     1 7 2  G3     4 0 2  G4     1 5 1  G4     6 7 8  G5     3 3 7  G6     1 2 2  G6     1 0 5  G7我想運(yùn)行cross_val_predict,同時(shí)確保來自同一組的所有樣本都在測(cè)試中或所有樣本都在訓(xùn)練中。我想將數(shù)據(jù)分成 4 份 - 但要確保來自同一組的所有行都在測(cè)試或訓(xùn)練中。因此,例如,第 0,1 行和第 4,5 行將在訓(xùn)練中,但第 3、6 行 (G3) 將在測(cè)試中這可能嗎?我在文檔中看到了grouparg,但不是很清楚,也沒有找到任何示例。
查看完整描述

1 回答

?
慕姐4208626

TA貢獻(xiàn)1852條經(jīng)驗(yàn) 獲得超7個(gè)贊

用作inGroupKFold的參數(shù):cvcross_val_predict()

scores = cross_val_score(model, X, y, groups, cv=GroupKFold())

請(qǐng)注意,groups數(shù)組表示我們希望在同一訓(xùn)練/測(cè)試集中的數(shù)據(jù)組。它不是類標(biāo)簽數(shù)組。

例如:

from sklearn.datasets import make_blobs

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import GroupKFold, cross_val_score


X, y = make_blobs(n_samples=15, random_state=0)


model = LogisticRegression()

groups = [0,0,0,1,1,1,1,2,2,2,2,3,3,3,3]

scores = cross_val_score(model, X, y, groups, cv=GroupKFold(n_splits=3))


print('cross val scores: {}'.format(scores))


查看完整回答
反對(duì) 回復(fù) 2023-01-04
  • 1 回答
  • 0 關(guān)注
  • 99 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)