首頁(yè) 猿問(wèn) 如何讀取圖像文件/機(jī)器學(xué)習(xí)圖像識(shí)別？

如何讀取圖像文件/機(jī)器學(xué)習(xí)圖像識(shí)別？

Python

aluckdog 2023-03-22 14:01:55

我正在考慮使用 python 和一些機(jī)器學(xué)習(xí)庫(kù)（即 keras、tensorflow...）創(chuàng)建一個(gè)圖像識(shí)別模型，我想知道是否有人可以啟發(fā)我關(guān)于為此類事情推薦哪些庫(kù)。（我以前做過(guò)圖像識(shí)別項(xiàng)目，但從來(lái)沒(méi)有達(dá)到我現(xiàn)在計(jì)劃的規(guī)模）。我的計(jì)劃是能夠檢測(cè) ASL 字母和數(shù)字，最終是單詞等。我的第一個(gè)障礙是我應(yīng)該如何將示例圖片轉(zhuǎn)換為可讀文件（即黑白數(shù)組中的 1 和 0，或者我是否應(yīng)該這樣做）。任何指導(dǎo)將不勝感激。

查看完整描述

1 回答

RISEBY

TA貢獻(xiàn)1856條經(jīng)驗(yàn) 獲得超5個(gè)贊

我所知道的大多數(shù) Python 計(jì)算機(jī)視覺(jué)應(yīng)用程序通常使用以下三個(gè)選項(xiàng)之一來(lái)加載到 numpy 數(shù)組中：

Scikit-圖像
OpenCV（注意：讀取 BGR 而不是 RGB）
枕頭

如果你的目標(biāo)是深度學(xué)習(xí)，PyTorch 有一些教程展示了對(duì) Pillow (PIL) 的支持，盡管一旦你有了 numpy 數(shù)組，使用任何 Python 圖像處理/計(jì)算機(jī)視覺(jué)庫(kù)并轉(zhuǎn)換為所需格式就相當(dāng)容易了。對(duì)于大多數(shù)大規(guī)模圖像處理應(yīng)用程序，這些都是可行的選擇。

反對(duì) 回復(fù) 2023-03-22