第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

從PDF中提取圖像,如何處理JBIG2編碼

從PDF中提取圖像,如何處理JBIG2編碼

慕俠2389804 2022-09-13 17:19:53
我有一堆PDF文件,其中一些是純文本,但有些全部或部分保存為“每頁一個圖像”,因為它們是從掃描儀生成的。我需要提取PDF中包含的所有圖像,然后分別檢查每個圖像。我能夠使用PYthon腳本提取大部分圖像,請參閱問題:從PDF中提取圖像而不重新采樣,在蟒蛇中?一些包含的圖像是使用JBIG2編碼的,我找不到任何python或其他工具將jbig2轉(zhuǎn)換為可以使用通用圖形工具輕松打開的東西。
查看完整描述

1 回答

?
HUX布斯

TA貢獻1876條經(jīng)驗 獲得超6個贊

好吧,我一直在努力解決這個問題很多周,SO的許多答案幫助我度過了難關(guān),但總?cè)鄙僖恍〇|西,顯然這里沒有人遇到過jbig2編碼圖像的問題。

在我要掃描的一堆PDF中,用jbig2編碼的圖像非常受歡迎。

據(jù)我所知,有許多復印/掃描機器可以掃描紙張并將其轉(zhuǎn)換為充滿jbig2編碼圖像的PDF文件。

因此,經(jīng)過多天的測試,決定選擇很久以前dkagedal在這里提出的答案。

以下是我對linux的一步一步:(如果你有另一個操作系統(tǒng),我建議使用Linux Docker,它會容易得多。

第一步:

然后我能夠運行命令行工具,稱為pdfimages,如下所示:

pdfimages -all myfile.pdf ./images_found/

使用上面的命令,您將能夠提取myfile中包含的所有圖像.pdf并且將它們保存在images_found中(您必須創(chuàng)建images_found之前)

在列表中,您可以找到幾種類型的圖像(取決于您的pdf),例如:png,jpg,tiff;所有這些都可以使用任何圖形工具輕松閱讀。

然后你會有一些文件命名為:-145.jb2e和-145.jb2g。

這2個文件包含一個圖像編碼在jbig2,這是保存在2個不同的文件,一個為標題和一個為數(shù)據(jù)

我再次失去了很多天,試圖找出如何將這些文件轉(zhuǎn)換為可讀的東西,最后我遇到了這個名為jbig2dec的工具。

因此,首先您需要安裝此神奇工具:

apt-get install jbig2dec

然后您可以運行:

jbig2dec -t png -145.jb2g -145.jb2e

您最終將能夠?qū)⑺刑崛〉膱D像轉(zhuǎn)換為有用的東西。

祝你好運!


查看完整回答
反對 回復 2022-09-13
  • 1 回答
  • 0 關(guān)注
  • 159 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號