我在TensorFlow中遇到一個(gè)奇怪的問題,我懷疑有一個(gè)簡(jiǎn)單的解決方案。我正在處理視頻數(shù)據(jù)。為了創(chuàng)建訓(xùn)練數(shù)據(jù),我曾經(jīng)ffmpeg將視頻幀提取到PNG文件中,然后使用LabelImg創(chuàng)建了邊界框數(shù)據(jù)集。經(jīng)過訓(xùn)練的網(wǎng)絡(luò)可以在這些PNG文件上正常工作。但是,如果我使用OpenCV打開視頻并將視頻中的幀饋送到網(wǎng)絡(luò),則根本不起作用。我使用像這樣的OpenCV VideoCapture類:video = cv2.VideoCapture(path_to_video)status, frame = video.read()output_dict = run_inference_for_single_image(frame, detection_graph)請(qǐng)注意,這run_inference_for_single_image是TensorFlow庫(kù)提供的功能,該功能用于對(duì)打開并轉(zhuǎn)換為numpy數(shù)組的PNG文件進(jìn)行檢測(cè)。我得到了一些檢測(cè)結(jié)果,但是準(zhǔn)確性幾乎降低到了零。相反,如果我將同一幀另存為PNG文件并將該文件饋入網(wǎng)絡(luò),則它將按預(yù)期工作。我需要更改什么以避免將視頻幀另存為PNG文件的步驟?
TensorFlow視頻幀與靜態(tài)圖像
慕標(biāo)琳琳
2021-04-01 17:19:39