Подсчет лиц на изображениях с помощью opencv: Счетчик не работает, когда BLOB-объект адаптирован к большему изображению - PullRequest
0 голосов
/ 23 марта 2020

(Обновлено)

Я создаю сценарий обнаружения лиц для изображений в Python с использованием opencv на основе следующей статьи блога: https://www.pyimagesearch.com/2018/02/26/face-detection-with-opencv-and-deep-learning/

Я добавил счетчик лиц, чтобы получить количество обнаружений лиц на изображение. Скрипт работает только с примерами изображений из статьи блога, но не с моим собственным изображением. Это намного больше, поэтому я изменяю размер blob, но, к сожалению, это приводит к отказу счетчика. Выдает неправильное количество обнаруженных лиц (насчитывает 66, но их только 15).

Вот мой код (пытаюсь избавить вас от ненужных частей):

...

ap.add_argument("-c", "--confidence", type=float, default=0.5,
    help="minimum probability to filter weak detections")
args = vars(ap.parse_args())

(не так важно. Это только для объяснения аргументов ["достоверность") ниже)

...

image = cv2.imread(args["image"])
(h, w) = image.shape[:2]
blob = cv2.dnn.blobFromImage(cv2.resize(image, (5472,3072)), 1.0,
    (300, 300), (104.0, 177.0, 123.0))

net.setInput(blob)
detections = net.forward()

(входное изображение загружается и преобразуется в a blob. Я изменил исходное разрешение (300, 300) на (5472,3072). Затем blob передается по сети для получения лица detections (type = ndarray))

for i in range(0, detections.shape[2]):
    confidence = detections[0, 0, i, 2]

    if confidence > args["confidence"]:
        box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])
        (startX, startY, endX, endY) = box.astype("int")

        text = "{:.2f}%".format(confidence * 100)
        y = startY - 10 if startY - 10 > 10 else startY + 10
        cv2.rectangle(image, (startX, startY), (endX, endY),
            (0, 0, 255), 2)
        cv2.putText(image, text, (startX, y),
            cv2.FONT_HERSHEY_SIMPLEX, 0.45, (0, 0, 255), 2)

(не так важно: обнаруженные лица отмечены прямоугольниками и текстом на выходном изображении)

count = np.sum(detections[0, 0, :, 2] > args['confidence'])

print("[INFO]",count, "faces detected")

Эта последняя часть подсчитывает лица на выходном изображении, и странно то, что оно не соответствует на количество прямоугольников с текстом на выходном изображении.

В документации blob и opencv (https://www.pyimagesearch.com/2017/11/06/deep-learning-opencvs-blobfromimage-works/) говорится, что он адаптируется к разным размерам изображений, просто изменяя размер blob, но каким-то образом не работает.

Есть идеи? Буду очень признателен за любые предложения по улучшению! Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...