現(xiàn)在需要實(shí)現(xiàn)這樣一個(gè)功能:給出圖片,圖片中包含有文字,可能是漢字,可能是英語,也可能是其他文字。要做的事情是識(shí)別出該文字是何種語言,給出結(jié)果就行,對(duì)內(nèi)容識(shí)別的準(zhǔn)確度沒有要求?,F(xiàn)在我自己的思路是這樣的:1.將原圖切割到規(guī)定大小2.預(yù)處理:降噪,灰度化,二值化3.劃分為訓(xùn)練集,驗(yàn)證集,測(cè)試集4.構(gòu)建CNN開始訓(xùn)練模型但是在第4步遇到了問題,不太知道該如何提取特征,另外數(shù)據(jù)集中圖片的大小不是固定的。我想過用resize的方法,但是可能會(huì)丟失掉一些重要信息,會(huì)影響結(jié)果,所以想問一下有沒有什么辦法解決圖片大小不固定的問題。希望能夠得到大家指點(diǎn),謝謝!
用深度學(xué)習(xí)識(shí)別語種識(shí)別
瀟瀟雨雨
2018-09-03 21:23:54