首頁(yè) 猿問光學(xué)字符識(shí)別多行檢測(cè)

光學(xué)字符識(shí)別多行檢測(cè)

Python

元芳怎么了 2021-09-25 21:04:59

我正在構(gòu)建一個(gè) OCR。為此，我正在使用CNN,RNN和CTC損失函數(shù)。我的輸入層獲取圖像，輸出層預(yù)測(cè)該圖像上寫的內(nèi)容。標(biāo)簽被轉(zhuǎn)換為整數(shù)。['A', 'B', 'C'] -> A = 0, B = 1, C = 2如果圖像是 ABC，則訓(xùn)練標(biāo)簽將為 0,1,2（單行向量）我能夠在單行上完成此操作。例如。' ABCDE' 寫在圖像上，模型效果很好。但如果圖像是'ABC' 'CAB'那么訓(xùn)練標(biāo)簽應(yīng)該是什么？我如何告訴模型下一行？我想在多行上訓(xùn)練一個(gè)模型。

查看完整描述