1 回答

TA貢獻(xiàn)1790條經(jīng)驗(yàn) 獲得超9個(gè)贊
Tesseract
有多種頁面切分模式,選擇合適的切分模式有助于獲得最佳效果。
同樣在這種情況下,您可以限制tesseract
為特定字符集。
另一件事tesseract
是對(duì)字體和圖像大小敏感。一個(gè)簡(jiǎn)單的調(diào)整大小可以大大改變結(jié)果。在這里,我將圖像大小水平更改為 2,垂直更改以獲得最佳結(jié)果;)
結(jié)合以上所有內(nèi)容,您將獲得:
custom_config = r'--psm 6? -c tessedit_char_whitelist=0123456789.'
print(pytesseract.image_to_string(inverted.resize((1506, 412), Image.ANTIALIAS), config=custom_config))
? ? ??
1525 .199 303 82 161 162 7 .241
1464 .290 424 70 139 198 25 .352
1456 .292 425 116 224 224 0 .345
1433 .240 346 81 130 187 15 .275
1390 .273 373 108 217 216 3 .345
1386 .276 383 54 181 154 18 .315
1225 .208 255 68 148 129 1 .242
1218 .238 230 46 128 127 18 .273
1117 .240 268 43 113 1193 1 .308
添加回答
舉報(bào)