Отправить несколько кадров в AWS rekognition - PullRequest
0 голосов
/ 07 июня 2018

Я пытаюсь отправить изображения в aws rekognition со своей веб-камеры, чтобы определить активность человека, сидящего перед ним с помощью python.

Для этого я делаю снимок каждые 5 секунд иотправь это в aws.Но когда я делаю это, кажется, что он всегда отправляет информацию о первом отправленном мною кадре

cap = cv2.VideoCapture(0)

while 1:
   ret, img = cap.read()
   client=boto3.client('rekognition')

   print("hello")
   ret, fileImg=cv2.imencode('.png',img)
   response = client.detect_labels(Image={'Bytes':fileImg.tobytes()})
   print('Detected labels for Camera Capture')    
   for label in response['Labels']:
       print (label['Name'] + ' : ' + str(label['Confidence']))

   sleep(5)

Вот результат, который я получаю от этого звонка:

Detected labels for Camera Capture
Human : 99.1103897095
People : 99.1103744507
Person : 99.1103897095
Face : 56.5527687073
Crypt : 51.1719360352
hello
Detected labels for Camera Capture
Human : 99.0247421265
People : 99.0247344971
Person : 99.0247421265
Face : 57.7796173096
Lighting : 51.8473701477
Crypt : 51.08152771
hello
Detected labels for Camera Capture
Human : 99.0808181763
People : 99.0808105469
Person : 99.0808181763
Face : 56.4268836975
Lighting : 54.6302490234
Crypt : 50.8622779846
hello

Знание во времяво время звонка изображение сильно изменилось и должно (по крайней мере, я так думаю) показать мне другие результаты.

1 Ответ

0 голосов
/ 07 июня 2018

Вот код, который я использую для наложения прямоугольников вокруг лиц аналогичным образом:

import cv2
import numpy as np
import boto3

# Setup
scale_factor = .15
green = (0,255,0)
red = (0,0,255)
frame_thickness = 2
cap = cv2.VideoCapture(0)
rekognition = boto3.client('rekognition')

while(True):

    # Capture frame-by-frame
    ret, frame = cap.read()
    height, width, channels = frame.shape

    # Convert frame to jpg
    small = cv2.resize(frame, (int(width * scale_factor), int(height * scale_factor)))
    ret, buf = cv2.imencode('.jpg', small)

    # Detect faces in jpg
    faces = rekognition.detect_faces(Image={'Bytes':buf.tobytes()}, Attributes=['ALL'])

    # Draw rectangle around faces
    for face in faces['FaceDetails']:
        smile = face['Smile']['Value']
        cv2.rectangle(frame,
                      (int(face['BoundingBox']['Left']*width),
                       int(face['BoundingBox']['Top']*height)),
                      (int((face['BoundingBox']['Left']+face['BoundingBox']['Width'])*width),
                       int((face['BoundingBox']['Top']+face['BoundingBox']['Height'])*height)),
                      green if smile else red, frame_thickness)

    # Display the resulting frame
    cv2.imshow('frame', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# When everything done, release the capture
cap.release()
cv2.destroyAllWindows()

Уменьшает изображение, потому что для распознавания лиц не требуется полный размер.

...