第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問題,去搜搜看,總會(huì)有你想問的

圖像處理,以提高tesseract OCR的準(zhǔn)確性

圖像處理,以提高tesseract OCR的準(zhǔn)確性

梵蒂岡之花 2019-09-18 14:35:37
我一直在使用tesseract將文檔轉(zhuǎn)換為文本。文檔的質(zhì)量范圍非常廣泛,我正在尋找有關(guān)哪種圖像處理可能會(huì)改善結(jié)果的提示。我注意到高度像素化的文本 - 例如由傳真機(jī)生成的文本 - 對(duì)于tesseract來說特別難以處理 - 可能是角色的所有鋸齒狀邊緣都會(huì)混淆形狀識(shí)別算法。什么樣的圖像處理技術(shù)可以提高準(zhǔn)確度?我一直在使用高斯模糊來平滑像素化圖像并看到一些小的改進(jìn),但我希望有一種更具體的技術(shù)可以產(chǎn)生更好的結(jié)果。假設(shè)一個(gè)過濾器被調(diào)整為黑白圖像,這將平滑不規(guī)則的邊緣,然后是一個(gè)過濾器,它會(huì)增加對(duì)比度,使角色更加清晰。對(duì)于圖像處理新手的任何一般提示?
查看完整描述

3 回答

?
慕的地10843

TA貢獻(xiàn)1785條經(jīng)驗(yàn) 獲得超8個(gè)贊

我絕不是OCR專家。但本周我需要將文本轉(zhuǎn)換為jpg。

我開始使用彩色RGB 445x747像素jpg。我立即嘗試了tesseract,程序幾乎沒有轉(zhuǎn)換。然后我進(jìn)入GIMP并做了以下事情。圖像>模式>灰度圖像>比例圖像> 1191x2000像素濾鏡>增強(qiáng)>非銳化蒙版,其值為半徑= 6.8,量= 2.69,閾值= 0然后我以100%質(zhì)量保存為新的jpg。

然后,Tesseract能夠?qū)⑺形谋咎崛〉?txt文件中

Gimp是你的朋友。


查看完整回答
反對(duì) 回復(fù) 2019-09-18
  • 3 回答
  • 0 關(guān)注
  • 1134 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)