現(xiàn)在需要實現(xiàn)這樣一個功能:給出圖片,圖片中包含有文字,可能是漢字,可能是英語,也可能是其他文字。要做的事情是識別出該文字是何種語言,給出結(jié)果就行,對內(nèi)容識別的準(zhǔn)確度沒有要求?,F(xiàn)在我自己的思路是這樣的:1.將原圖切割到規(guī)定大小2.預(yù)處理:降噪,灰度化,二值化3.劃分為訓(xùn)練集,驗證集,測試集4.構(gòu)建CNN開始訓(xùn)練模型但是在第4步遇到了問題,不太知道該如何提取特征,另外數(shù)據(jù)集中圖片的大小不是固定的。我想過用resize的方法,但是可能會丟失掉一些重要信息,會影響結(jié)果,所以想問一下有沒有什么辦法解決圖片大小不固定的問題。希望能夠得到大家指點,謝謝!
用深度學(xué)習(xí)識別語種識別
瀟瀟雨雨
2018-09-03 21:23:54