我正在考慮使用 python 和一些機(jī)器學(xué)習(xí)庫(kù)(即 keras、tensorflow...)創(chuàng)建一個(gè)圖像識(shí)別模型,我想知道是否有人可以啟發(fā)我關(guān)于為此類事情推薦哪些庫(kù)。(我以前做過(guò)圖像識(shí)別項(xiàng)目,但從來(lái)沒(méi)有達(dá)到我現(xiàn)在計(jì)劃的規(guī)模)。我的計(jì)劃是能夠檢測(cè) ASL 字母和數(shù)字,最終是單詞等。我的第一個(gè)障礙是我應(yīng)該如何將示例圖片轉(zhuǎn)換為可讀文件(即黑白數(shù)組中的 1 和 0,或者我是否應(yīng)該這樣做)。任何指導(dǎo)將不勝感激。
1 回答

RISEBY
TA貢獻(xiàn)1856條經(jīng)驗(yàn) 獲得超5個(gè)贊
我所知道的大多數(shù) Python 計(jì)算機(jī)視覺(jué)應(yīng)用程序通常使用以下三個(gè)選項(xiàng)之一來(lái)加載到 numpy 數(shù)組中:
Scikit-圖像
OpenCV(注意:讀取 BGR 而不是 RGB)
枕頭
如果你的目標(biāo)是深度學(xué)習(xí),PyTorch 有一些教程展示了對(duì) Pillow (PIL) 的支持,盡管一旦你有了 numpy 數(shù)組,使用任何 Python 圖像處理/計(jì)算機(jī)視覺(jué)庫(kù)并轉(zhuǎn)換為所需格式就相當(dāng)容易了。對(duì)于大多數(shù)大規(guī)模圖像處理應(yīng)用程序,這些都是可行的選擇。
添加回答
舉報(bào)
0/150
提交
取消