Question

Я обучил пользовательской модели обнаружения объектов, используя образ докера Nvidia Digits . Теперь я хочу запустить эту модель, используя только OpenCV Python (т.е. не Caffe, TensorRT и т. Д.) Я могу успешно загрузить и запустить мою модель, используя модуль DNN OpenCV, но мне нужно удалить последний слойв "deploy.prototxt", называемом "ClusterDetections", поскольку OpenCV не поддерживает этот тип слоя, выдавая ошибку:

Невозможно создать «кластер» слоя типа «Python» в функции'getLayerInstance'

Как уже упоминалось, эта ошибка исчезнет, если я удалю неподдерживаемый слой из "deploy.prototxt", но без слоя "ClusterDetections" у меня останутся необработанные данные, возвращаемыеnet.forward() в незнакомом формате, который сильно отличается от ожидаемого выхода сети.

Запуск print(print(detections[0,0,i,2]) (что обычно является оценкой достоверности для каждого класса) возвращает:

-11.059842 -14.562948 -14.037464 -13.557558 -13.167087 -12.759864 -12.131538 -11.58218 -11.353993 -11.398977 -11.459799 -11.529523 -11.670803 -11.776192 -12.514015 -14.56443 -16.339668 -16.761234 -18.237602 -20.796967 -13.148532 -5.987872

Это может просто означать, что на изображении, которое я передал в модель, не обнаружено никаких объектов, но с отсутствующим ClusterDetectionслой, я склонен думать, что на моем изображении могут быть обнаружены объекты, и я просто неправильно интерпретирую данные.

Я пытался реализовать настраиваемые функции кластеризации обнаружения в python, как предложено в этом посте , но безрезультатно. Другое решение Я обнаружил, что использует Caffe для реализации неподдерживаемого слоя. Но, как я уже упоминал ранее, для своего приложения я хочу использовать только OpenCV python для запуска модели. В связанном вопросе , который я задавал ранее, мне сказали использовать OpenCV Custom Layer Mechanic. Но даже после прочтения документации у меня все еще нет достаточно хорошей информации о том, как это работает, чтобы написать что-то с нуля, используя механику слоя.

По сути, мой вопрос таков:Есть ли простой способ компенсации неподдерживаемого слоя "ClusterDetections" и все еще запускать мою модель обнаружения объектов с использованием OpenCV? Потому что каждое решение, которое я нашел, либо не работает, либо говорит, что вам нужно использовать другую библиотеку, такую как Caffe или TensorRT.

Вот мой код, взятый из этого урока :

# import the necessary packages
import numpy as np
import argparse
import cv2

# construct the argument parse and parse the arguments
ap = argparse.ArgumentParser()
ap.add_argument("-i", "--image", required=True,
    help="path to input image")
ap.add_argument("-p", "--prototxt", required=True,
    help="path to Caffe 'deploy' prototxt file")
ap.add_argument("-m", "--model", required=True,
    help="path to Caffe pre-trained model")
ap.add_argument("-c", "--confidence", type=float, default=0.2,
    help="minimum probability to filter weak detections")
args = vars(ap.parse_args())

# initialize the list of class labels MobileNet SSD was trained to
# detect, then generate a set of bounding box colors for each class
CLASSES = ["background", "aeroplane", "bicycle", "bird", "boat",
    "bottle", "bus", "car", "cat", "chair", "cow", "diningtable",
    "dog", "horse", "motorbike", "person", "pottedplant", "sheep",
    "sofa", "train", "tvmonitor"]
COLORS = np.random.uniform(0, 255, size=(len(CLASSES), 3))

# load our serialized model from disk
print("[INFO] loading model...")
net = cv2.dnn.readNetFromCaffe(args["prototxt"], args["model"])

# load the input image and construct an input blob for the image
# by resizing to a fixed 300x300 pixels and then normalizing it
# (note: normalization is done via the authors of the MobileNet SSD
# implementation)
image = cv2.imread(args["image"])
(h, w) = image.shape[:2]
blob = cv2.dnn.blobFromImage(cv2.resize(image, (1248, 352)), 0.007843,
    (1248, 352), 127.5)

# pass the blob through the network and obtain the detections and
# predictions
print("[INFO] computing object detections...")
net.setInput(blob)
detections = net.forward()

# loop over the detections
for i in np.arange(0, detections.shape[2]):
    # extract the confidence (i.e., probability) associated with the
    # prediction
    confidence = detections[0, 0, i, 2]
    print(detections[0,0,i,2])
    # filter out weak detections by ensuring the `confidence` is
    # greater than the minimum confidence
    if confidence > args["confidence"]:
        # extract the index of the class label from the `detections`,
        # then compute the (x, y)-coordinates of the bounding box for
        # the object
        idx = int(detections[0, 0, i, 1])
        box = detections[0, 0, i, 3:7] * np.array([w, h, w, h])
        (startX, startY, endX, endY) = box.astype("int")

        # display the prediction
        label = "{}: {:.2f}%".format(CLASSES[idx], confidence * 100)
        print("[INFO] {}".format(label))
        cv2.rectangle(image, (startX, startY), (endX, endY),
            COLORS[idx], 2)
        y = startY - 15 if startY - 15 > 15 else startY + 15
        cv2.putText(image, label, (startX, y),
            cv2.FONT_HERSHEY_SIMPLEX, 0.5, COLORS[idx], 2)

# show the output image
cv2.imshow("Output", image)
cv2.waitKey(0)

Здесь - это изображение, на котором я запускал модель.

Я использую Python 3.6 и OpenCV 4.1.1. Файлы, необходимые для воспроизведения моих текущих функций, можно найти на диске Google здесь.

Как запустить Cafemodel Detectnet без слоя «ClusterDetections»?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как запустить Cafemodel Detectnet без слоя «ClusterDetections»?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы