我使用 Keras 后端函數(shù)編寫(xiě)了 huber loss,效果很好:def huber_loss(y_true, y_pred, clip_delta=1.0): error = y_true - y_pred cond = K.abs(error) < clip_delta squared_loss = 0.5 * K.square(error) linear_loss = clip_delta * (K.abs(error) - 0.5 * clip_delta) return tf_where(cond, squared_loss, linear_loss)但我需要一個(gè)更復(fù)雜的損失函數(shù):如果error <= A,使用squared_loss如果A <= error < B,使用線性損失如果error >= B,使用sqrt_loss我是這樣寫(xiě)的:def best_loss(y_true, y_pred, A, B): error = K.abs(y_true - y_pred) cond = error <= A cond2 = tf_logical_and(A < error, error <= B) squared_loss = 0.5 * K.square(error) linear_loss = A * (error - 0.5 * A) sqrt_loss = A * np.sqrt(B) * K.sqrt(error) - 0.5 * A**2 return tf_where(cond, squared_loss, tf_where(cond2, linear_loss, sqrt_loss))但是不行,用這個(gè)損失函數(shù)的模型不收斂,有什么bug?
1 回答

呼喚遠(yuǎn)方
TA貢獻(xiàn)1856條經(jīng)驗(yàn) 獲得超11個(gè)贊
我喜歡通過(guò)使用像 Desmos 這樣的程序繪制自定義函數(shù)的圖形來(lái)調(diào)試它們。我使用您的實(shí)現(xiàn)繪制了 Huber 損失圖,它看起來(lái)應(yīng)該是這樣的。
當(dāng)我嘗試?yán)L制第二個(gè)函數(shù)的圖表時(shí),它看起來(lái)也像是一個(gè)有效的損失函數(shù)。唯一的問(wèn)題是當(dāng) B 小于 A 時(shí)。如果 B 的值大于 A,那么損失函數(shù)應(yīng)該不會(huì)有問(wèn)題。如果這不是問(wèn)題,那么您可以嘗試在目標(biāo)和輸出之間切換減法,因?yàn)槲也皇煜埩苛魅绾翁幚砦⒎?,但順序?huì)影響梯度的方向。
添加回答
舉報(bào)
0/150
提交
取消