我正在構(gòu)建一個(gè) OCR。為此,我正在使用CNN,RNN和CTC損失函數(shù)。我的輸入層獲取圖像,輸出層預(yù)測(cè)該圖像上寫的內(nèi)容。標(biāo)簽被轉(zhuǎn)換為整數(shù)。['A', 'B', 'C'] -> A = 0, B = 1, C = 2如果圖像是 ABC,則訓(xùn)練標(biāo)簽將為 0,1,2(單行向量)我能夠在單行上完成此操作。例如。' ABCDE' 寫在圖像上,模型效果很好。但如果圖像是'ABC'
'CAB'那么訓(xùn)練標(biāo)簽應(yīng)該是什么?我如何告訴模型下一行?我想在多行上訓(xùn)練一個(gè)模型。
添加回答
舉報(bào)
0/150
提交
取消