使用 CV2 和 DeepFace 加速实时人脸检测

Question

我正在尝试构建一个应满足这些要求的实时人脸检测器：

快
即使在较暗的环境条件下也尽可能准确
检测后我可以轻松添加人脸识别模型

这些要求促使我构建了一个脚本，用于从网络摄像头捕获帧，并使用 MTCNN 模型分析这些帧并最终给出输出。即使在较暗的环境中，该解决方案也使我能够获得不错的准确度，并在大约 3.6 秒内检测到面部（一次分析 3 帧，这在准确度和速度之间似乎很划算）。这是我实际使用的代码：

import cv2
from time import sleep
from deepface import DeepFace
import os
import datetime

frames_analyzed = 3
backends = [
  'opencv', 
  'ssd', 
  'dlib', 
  'mtcnn', 
  'retinaface', 
  'mediapipe',
  'yolov8',
  'yunet',
]

while True:
        i = 0
        start_time = datetime.datetime.now()

        while i < frames_analyzed:
                vidcap = cv2.VideoCapture(0)
                if vidcap.isOpened():
                    ret, frame = vidcap.read()
                    if ret:
                        cv2.imwrite("Frames/"+str(i)+".jpg",frame)
                    else:
                        print("Error : Failed to capture frame")
                else:
                    print("Cannot open camera")
                vidcap.release()
                i = i+1
                
        face_detected = 0
        
        for i in range(frames_analyzed-1):
                try:
                        DeepFace.extract_faces(img_path = "Frames/"+str(i)+".jpg", detector_backend = backends[3])
                        face_detected = face_detected+1
                except:
                        continue
                os.remove("Frames/"+str(i)+".jpg")

        end_time = datetime.datetime.now()  
        print(face_detected, (end_time-start_time).total_seconds())

这些是我的问题：

我的方法对于实时人脸检测是否合理？
我可以应用任何更改来在快速和准确之间获得更好的平衡吗？

Answer 1

对于问题2：

您可以使用 Mediapipe 代替 MTCNN，这可能是最快的检测器；
如果你有 GPU / CUDA - 你可以尝试 dlib，它在 GPU 上的运行速度比在 CPU 上快 50 倍。

Answer 2

默认人脸识别模型为VGG-Face。尝试使用 Facenet 或 ArcFace 模型在实时应用程序中获得更快的结果。

默认检测器是 opencv，速度快但精度低。 Mediapipe 提供了比 opencv 更好的结果，但根据速度和准确性，mtcnn 仍然是最佳选择。

使用 CV2 和 DeepFace 加速实时人脸检测

问题描述投票：0回答：2

2个回答

最新问题

使用 CV2 和 DeepFace 加速实时人脸检测

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2