我一直在使用tesseract將文檔轉(zhuǎn)換為文本。文檔的質(zhì)量范圍非常廣泛,我正在尋找有關(guān)哪種圖像處理可能會(huì)改善結(jié)果的提示。我注意到高度像素化的文本 - 例如由傳真機(jī)生成的文本 - 對(duì)于tesseract來說特別難以處理 - 可能是角色的所有鋸齒狀邊緣都會(huì)混淆形狀識(shí)別算法。什么樣的圖像處理技術(shù)可以提高準(zhǔn)確度?我一直在使用高斯模糊來平滑像素化圖像并看到一些小的改進(jìn),但我希望有一種更具體的技術(shù)可以產(chǎn)生更好的結(jié)果。假設(shè)一個(gè)過濾器被調(diào)整為黑白圖像,這將平滑不規(guī)則的邊緣,然后是一個(gè)過濾器,它會(huì)增加對(duì)比度,使角色更加清晰。對(duì)于圖像處理新手的任何一般提示?
3 回答

慕的地10843
TA貢獻(xiàn)1785條經(jīng)驗(yàn) 獲得超8個(gè)贊
我絕不是OCR專家。但本周我需要將文本轉(zhuǎn)換為jpg。
我開始使用彩色RGB 445x747像素jpg。我立即嘗試了tesseract,程序幾乎沒有轉(zhuǎn)換。然后我進(jìn)入GIMP并做了以下事情。圖像>模式>灰度圖像>比例圖像> 1191x2000像素濾鏡>增強(qiáng)>非銳化蒙版,其值為半徑= 6.8,量= 2.69,閾值= 0然后我以100%質(zhì)量保存為新的jpg。
然后,Tesseract能夠?qū)⑺形谋咎崛〉?txt文件中
Gimp是你的朋友。
- 3 回答
- 0 關(guān)注
- 1134 瀏覽
添加回答
舉報(bào)
0/150
提交
取消