1 回答

TA貢獻(xiàn)1877條經(jīng)驗(yàn) 獲得超6個(gè)贊
不,那不會(huì)錯(cuò),在這兩種情況下,您首先要適應(yīng)數(shù)據(jù)而不是轉(zhuǎn)換數(shù)據(jù)。每次使用 fit 時(shí),它都會(huì)覆蓋現(xiàn)有的。這是一個(gè)例子:
a = np.array([[1, 3],
[np.nan, 2],
[5, 9]])
c = np.array([[3, 4],
[6, 12],
[8, np.nan]])
imp = SimpleImputer(strategy="mean")
a1 = imp.fit_transform(a)
c1 = imp.fit_transform(c)
現(xiàn)在讓我們看看輸出:
a1: array([[1., 3.],
[3., 2.],
[5., 9.]])
c1: array([[ 3., 4.],
[ 6., 12.],
[ 8., 8.]])
取兩列的平均值(如 sklearn doc. 所說)并估算平均值。這在 KNNImputer 中也應(yīng)該同樣有效。
添加回答
舉報(bào)