首頁(yè) 猿問(wèn) 我想從圖像文件中抓取文本并將其存儲(chǔ)...

我想從圖像文件中抓取文本并將其存儲(chǔ)在 excel 中

Java

楊魅力 2023-03-17 15:46:47

保齡球 OMRW ECON 0s 45 6 WD NB 失去 Dhoni 作為擊球手對(duì)我們來(lái)說(shuō)總是很困難 - Raina TABoult 4 0 3 0 925 M 2 3 1 0 Chennai Super Kings 擊球手在淡季后表現(xiàn)出色，JETED 6 0 = 4 O 0 0 受到稱(chēng)贊Dhoni 在折痕處的支持 CHMorris 4 0 4 ns o9 8 1 1 對(duì)陣德里首都 AR Patel 3 o 3 1 1033 6 3 2 oo “看球，擊球” - Dhoni 的決賽公式 o0 e sEoe 10 oo在 IPL 比賽的第 20 場(chǎng)比賽中，CSK 隊(duì)長(zhǎng)在 PR el 227 球中打出 554 分。那是他在本次錦標(biāo)賽中取得的所有成績(jī)的 13%。德里首都局（目標(biāo)：20 局 180 分）談話要點(diǎn) - Dhoni babering @EEIEER -這是我想要在 excel 中使用的字符串

查看完整描述

2 回答

子衿沉夜

TA貢獻(xiàn)1828條經(jīng)驗(yàn) 獲得超3個(gè)贊

根據(jù)對(duì)您想做什么的稀疏描述，我建議：

從圖像中讀取文本
用冒號(hào)替換所有空格 String csvContent = imgData.replaceAll(" ",";");
將文本保存到 csv 文件
用excel打開(kāi)csv文件

以下示例假定您已設(shè)法檢索數(shù)據(jù)，然后對(duì)這些數(shù)據(jù)進(jìn)行后處理以提供 csv 格式。內(nèi)容被寫(xiě)入一個(gè)文件，您只需雙擊該文件即可看到數(shù)據(jù)是否按照您的要求分成了列。

String[] data = new String[] {

"BOWLING O M R W ECON 0s 45 6", //notice that your OCR software does not properly recognise the string here

"TABoult 4 0 3 0 925 M 2 3",

"JETED 6 0 = 4 O 0 0"

};

BufferedWriter writer = new BufferedWriter( new FileWriter( System.getProperty( "user.home" ) + System.getProperty( "file.separator" ) + "data.csv" ) );

for( String record : data ) {

writer.write( record.replaceAll( " ", ";" ) );

writer.write( "\n" );

}

writer.close();

就像我在上面的評(píng)論中所說(shuō)的那樣，您的 OCR 無(wú)法正常工作。我建議您查看 JSOUP html 解析器以獲取信息并從那里繼續(xù)。否則你不會(huì)對(duì)結(jié)果滿意。

反對(duì) 回復(fù) 2023-03-17

qq_遁去的一_1

TA貢獻(xiàn)1725條經(jīng)驗(yàn) 獲得超8個(gè)贊

driver.get("https://www.espncricinfo.com/series/8048/scorecard/1178425/chennai-super-kings-vs-delhi-capitals-50th-match-indian-premier-league-2019"); WebElement element = driver.findElement(By.xpath("//article[@class='sub-module scorecard'][1]")); JavascriptExecutor js = (JavascriptExecutor) 驅(qū)動(dòng)程序；js.executeScript("arguments[0].scrollIntoView(true);", element);

File screen = ((TakesScreenshot)driver).getScreenshotAs(OutputType.FILE);

File file = new File("C:\\Users\\user\\Desktop\\screenshot1\\screenshotOfElement2.png");

FileHandler.copy(screen, file);

ITesseract instance = new Tesseract();

instance.setDatapath("C:\\selenium_work\\ScrapingText.PDF\\tessdata");

String result = instance.doOCR(file);

//System.out.println(result);

String[] lines = result.split("\\n");

this one what am trying

反對(duì) 回復(fù) 2023-03-17

2 回答
0 關(guān)注
135 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

我想從圖像文件中抓取文本并將其存儲(chǔ)在 excel 中

我想從圖像文件中抓取文本并將其存儲(chǔ)在 excel 中

2 回答

添加回答