我試過(guò) tesseract 但它只適用于純文本文檔,任何人都可以建議我該怎么做嗎? 這是我的 vb.net 代碼Dim pic = New Bitmap(OpenFileDialog1.FileName) Dim ocr = New TesseractEngine("./dataset", "eng", EngineMode.TesseractAndCube) Dim page = ocr.Process(pic) TextBox1.Text = page.GetText
1 回答

喵喔喔
TA貢獻(xiàn)1735條經(jīng)驗(yàn) 獲得超5個(gè)贊
看起來(lái)你的答題紙結(jié)構(gòu)合理。我會(huì)專注于為每個(gè)答案提取子圖像,然后在該圖像上以單字符模式運(yùn)行 Tesseract。我不確定你如何在你使用的任何 Tesseract 包裝器中獲得單字符模式,但通過(guò)命令行它是參數(shù):--psm 10
。
要提取每個(gè)圖像,我會(huì)使用 OpenCV(嘗試Emgu for .NET)。您可能需要先應(yīng)用透視環(huán)繞以獲得正方形圖像。然后您可以使用一個(gè)簡(jiǎn)單的滑動(dòng)窗口來(lái)獲取每個(gè)子圖像。
我不確定在答案被劃掉的情況下這將如何執(zhí)行。
- 1 回答
- 0 關(guān)注
- 112 瀏覽
添加回答
舉報(bào)
0/150
提交
取消