1 回答
TA貢獻(xiàn)1810條經(jīng)驗(yàn) 獲得超4個(gè)贊
在寫下面的所有內(nèi)容時(shí),我想起了這件事,這是“面部識(shí)別”的第一個(gè)谷歌結(jié)果,但我從未真正嘗試過(guò),因此無(wú)法發(fā)表評(píng)論。
使用您描述的設(shè)置,特征臉將在一定程度上起作用。最好把舞臺(tái)稍微抬高一點(diǎn),在講臺(tái)上安裝攝像頭,這樣大多數(shù)時(shí)候每個(gè)人都直視它,但可惜。
我只會(huì)嘗試列出您可以做的事情/嘗試不按特定順序改進(jìn)結(jié)果。
我個(gè)人主要處理神經(jīng)網(wǎng)絡(luò),所以我的第一個(gè)猜測(cè)是嘗試 OpenFace,但它是一種訓(xùn)練和運(yùn)行的相當(dāng)昂貴的方法(需要一個(gè)更大的數(shù)據(jù)庫(kù),每個(gè)人有多張圖片等;識(shí)別時(shí)間每人最多一秒),這對(duì)于這項(xiàng)任務(wù)來(lái)說(shuō)可能是一種矯枉過(guò)正。也許你會(huì)在這里找到一些有趣的東西。
您遇到的第一個(gè)問(wèn)題是數(shù)據(jù)庫(kù)中的圖片可能是人像照片,但相機(jī)會(huì)相對(duì)于它面朝下拾取它們。您需要在識(shí)別前進(jìn)行一些預(yù)處理,以根據(jù)角度進(jìn)行調(diào)整。好消息是人們坐得越遠(yuǎn),臉越不變形,即使質(zhì)量更差。有 2 種方法可以做到。
一種是選擇不同的特征(眼睛+鼻尖)和仿射變換,直到它們符合相當(dāng)簡(jiǎn)單的標(biāo)準(zhǔn),但你會(huì)丟失一些信息,比如鼻子長(zhǎng)度等。而且你必須在之前對(duì)數(shù)據(jù)庫(kù)圖片做同樣的事情你訓(xùn)練。
另一種是通過(guò)使用圖片中的人臉 ROI 坐標(biāo)并在此基礎(chǔ)上進(jìn)行變換來(lái)自己完成。它更容易,現(xiàn)在我想它甚至可能更可靠。然而,它不能糾正面部?jī)A斜和其他一些事情。
如果角度太大,這一切都可能會(huì)分崩離析,但是idk。
第二件事是基于事實(shí)的啟發(fā)式,即視頻而不是靜態(tài)鏡頭。我們用它來(lái)識(shí)別車牌,但它相當(dāng)簡(jiǎn)單。這個(gè)想法是你有一個(gè)對(duì)象數(shù)組,它們是可識(shí)別的面孔。您檢查檢測(cè)到的面部是否對(duì)應(yīng)于預(yù)先存在的對(duì)象之一的每一幀。這些因素是與過(guò)去分類器響應(yīng)的距離和相似性。你記錄分類器響應(yīng)和它做出的猜測(cè),基于那些你對(duì)特定猜測(cè)積累的信心(這里有很多啟發(fā)式方法,比如如果沒(méi)有接近的替代猜測(cè),則積累更多,考慮檢測(cè)器響應(yīng)等)。一旦你在某個(gè)幀中沒(méi)有檢測(cè)到那張臉,你就可以讓對(duì)象在任意時(shí)間內(nèi)保持活動(dòng)狀態(tài),甚至可以使用寬松的參數(shù)再次在特定區(qū)域上運(yùn)行檢測(cè)器。你明白我希望的想法。這只是一堆啟發(fā)式方法。
然后,在對(duì)某些視頻進(jìn)行識(shí)別后,您可以獲取一些高可信度識(shí)別的面部幀(或手動(dòng)過(guò)濾它們),并對(duì)它們進(jìn)行更多訓(xùn)練以強(qiáng)化模型。
如果有人戴太陽(yáng)鏡/棒球帽,也可能會(huì)增加一小步改變并相應(yīng)地調(diào)整。(我會(huì)說(shuō)干擾太多,你應(yīng)該放棄,但你可以將相應(yīng)的案例添加到訓(xùn)練中或以其他方式處理)它不應(yīng)該增加太多處理時(shí)間,因?yàn)闄z測(cè)足夠自信的太陽(yáng)鏡應(yīng)該不要太難。在處理車牌時(shí),我們有一連串的小神經(jīng)網(wǎng)絡(luò)在大神經(jīng)網(wǎng)絡(luò)開(kāi)始行動(dòng)之前檢查各種事情。
我注意到大多數(shù)人臉檢測(cè)器返回的 ROI 太?。ū热缂舻纛^發(fā)等),可能想要擴(kuò)大一點(diǎn),但可能沒(méi)有必要。
添加回答
舉報(bào)
