(Обновлено)
Я создаю сценарий обнаружения лиц для изображений в Python с использованием opencv на основе следующей статьи блога: https://www.pyimagesearch.com/2018/02/26/face-detection-with-opencv-and-deep-learning/
Я добавил счетчик лиц, чтобы получить количество обнаружений лиц на изображение. Скрипт работает только с примерами изображений из статьи блога, но не с моим собственным изображением. Это намного больше, поэтому я изменяю размер blob
, но, к сожалению, это приводит к отказу счетчика. Выдает неправильное количество обнаруженных лиц (насчитывает 66, но их только 15).
Вот мой код (пытаюсь избавить вас от ненужных частей):
...
ap.add_argument("-c", "--confidence", type=float, default=0.5,
help="minimum probability to filter weak detections")
args = vars(ap.parse_args())
(не так важно. Это только для объяснения аргументов ["достоверность") ниже)
...
image = cv2.imread(args["image"])
(h, w) = image.shape[:2]
blob = cv2.dnn.blobFromImage(cv2.resize(image, (5472,3072)), 1.0,
(300, 300), (104.0, 177.0, 123.0))
net.setInput(blob)
detections = net.forward()
(входное изображение загружается и преобразуется в a blob
. Я изменил исходное разрешение (300, 300)
на (5472,3072)
. Затем blob
передается по сети для получения лица detections
(type = ndarray))
for i in range(0, detections.shape[2]):
confidence = detections[0, 0, i, 2]
if confidence > args["confidence"]:
box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])
(startX, startY, endX, endY) = box.astype("int")
text = "{:.2f}%".format(confidence * 100)
y = startY - 10 if startY - 10 > 10 else startY + 10
cv2.rectangle(image, (startX, startY), (endX, endY),
(0, 0, 255), 2)
cv2.putText(image, text, (startX, y),
cv2.FONT_HERSHEY_SIMPLEX, 0.45, (0, 0, 255), 2)
(не так важно: обнаруженные лица отмечены прямоугольниками и текстом на выходном изображении)
count = np.sum(detections[0, 0, :, 2] > args['confidence'])
print("[INFO]",count, "faces detected")
Эта последняя часть подсчитывает лица на выходном изображении, и странно то, что оно не соответствует на количество прямоугольников с текстом на выходном изображении.
В документации blob
и opencv
(https://www.pyimagesearch.com/2017/11/06/deep-learning-opencvs-blobfromimage-works/) говорится, что он адаптируется к разным размерам изображений, просто изменяя размер blob
, но каким-то образом не работает.
Есть идеи? Буду очень признателен за любые предложения по улучшению! Большое спасибо!