2 回答

TA貢獻(xiàn)1777條經(jīng)驗(yàn) 獲得超10個(gè)贊
您不需要重新初始化圖形。當(dāng)您請(qǐng)求輸出張量時(shí),Tensorflow 并沒有明確知道您是在進(jìn)行訓(xùn)練還是測(cè)試階段。相反,只要您評(píng)估優(yōu)化器(例如 tf.train.AdamOptimizer、tf.train.GradientDescentOptimizer 等)的最小化操作,就會(huì)發(fā)生反向傳播。
通常您不會(huì)在測(cè)試期間這樣做,因?yàn)槟噲D預(yù)測(cè)它在看不見的數(shù)據(jù)上的表現(xiàn)如何。但是,如果您想在進(jìn)行初始預(yù)測(cè)后將該數(shù)據(jù)添加到訓(xùn)練集中,只要您有辦法獲得真實(shí)值以便計(jì)算誤差張量,您就可以自由地這樣做。
即使在非在線學(xué)習(xí)中,穿插訓(xùn)練和測(cè)試通道也是很常見的:如果您使用驗(yàn)證集來確定提前停止,則您會(huì)在訓(xùn)練批次(您進(jìn)行反向傳播)和驗(yàn)證批次(您不進(jìn)行反向傳播)之間交替。

TA貢獻(xiàn)1829條經(jīng)驗(yàn) 獲得超6個(gè)贊
從你描述的情況來看:
例如,每當(dāng)用戶點(diǎn)擊一個(gè)項(xiàng)目時(shí),我想立即記錄該交互并從該交互中學(xué)習(xí)(僅針對(duì)該交互訓(xùn)練模型)。我怎樣才能做到這一點(diǎn)?
您可能想做的是在預(yù)訓(xùn)練模型之上進(jìn)行某種強(qiáng)化學(xué)習(xí)。
接下來要研究的是 OpenAIgym
包。
如何推薦系統(tǒng)可以與強(qiáng)化學(xué)習(xí)帶來的指南給出了這里的第一次講座(免費(fèi)審計(jì))。
添加回答
舉報(bào)