炎炎設(shè)計(jì)
2022-05-21 16:40:46
我正在嘗試將 PDF 預(yù)處理為 OCR 的 TIF 圖像。在命令行上,我可以通過使用以下 ImageMagick 命令將 PDF 轉(zhuǎn)換為 TIF 來完成此操作:$ convert -density 300 /path/to/my/document.pdf -depth 8 -strip -background white -alpha off file.tiff我怎樣才能在 Java 中獲得等效的結(jié)果?我目前可以使用 tess4j 將 PDF 轉(zhuǎn)換為 TIF,但是如何重新縮放和預(yù)處理生成的 tif?哪些庫可以讓我快速輕松地做到這一點(diǎn)?
1 回答

達(dá)令說
TA貢獻(xiàn)1821條經(jīng)驗(yàn) 獲得超6個(gè)贊
弄清楚了。與其嘗試學(xué)習(xí)另一個(gè)圖像預(yù)處理庫,我只是使用im4java來扭曲 IM 命令行,然后直接將命令翻譯成以下內(nèi)容:
ConvertCmd cmd = new ConvertCmd();
IMOperation op = new IMOperation();
op.addImage(imagePath);
op.density(300);
op.depth(8);
op.strip();
op.background("white");
op.alpha("off");
try {
cmd.run(op);
} catch (IOException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
} catch (IM4JavaException e) {
e.printStackTrace();
}
添加回答
舉報(bào)
0/150
提交
取消