首頁(yè) 猿問(wèn) 如何提取答題紙中的書面數(shù)字（圖片）

如何提取答題紙中的書面數(shù)字（圖片）

C#

慕姐8265434 2022-12-31 11:24:41

我試過(guò) tesseract 但它只適用于純文本文檔，任何人都可以建議我該怎么做嗎？這是我的 vb.net 代碼Dim pic = New Bitmap(OpenFileDialog1.FileName) Dim ocr = New TesseractEngine("./dataset", "eng", EngineMode.TesseractAndCube) Dim page = ocr.Process(pic) TextBox1.Text = page.GetText

查看完整描述

1 回答

喵喔喔

TA貢獻(xiàn)1735條經(jīng)驗(yàn) 獲得超5個(gè)贊

看起來(lái)你的答題紙結(jié)構(gòu)合理。我會(huì)專注于為每個(gè)答案提取子圖像，然后在該圖像上以單字符模式運(yùn)行 Tesseract。我不確定你如何在你使用的任何 Tesseract 包裝器中獲得單字符模式，但通過(guò)命令行它是參數(shù)：--psm 10。

要提取每個(gè)圖像，我會(huì)使用 OpenCV（嘗試Emgu for .NET）。您可能需要先應(yīng)用透視環(huán)繞以獲得正方形圖像。然后您可以使用一個(gè)簡(jiǎn)單的滑動(dòng)窗口來(lái)獲取每個(gè)子圖像。

我不確定在答案被劃掉的情況下這將如何執(zhí)行。

反對(duì) 回復(fù) 2022-12-31