Итак, у меня есть промышленная камера: Mako G-503B , которая способна захватывать только монохромное видео.
В настоящее время я обращаюсь к этой камере с помощью OpenCV на python, поскольку намереваюсь использовать Tensorflow и предварительно обученный CNN с набором данных COCO.К вашему сведению: ssd_mobilenet_v1_coco_2018_01_28
К сожалению, поскольку камера захватывает только монохромное видео, а модель ожидает вектор RGB, мне нужно выполнить преобразование.
Способ, которым я преобразовал свое изображение, заключался лишь в дублировании изображения.Двухмерный монохромный пиксельный массив в трехмерный массив:
img_array = np.array([img.shape[0], img.shape[1],3])
img3d = np.dstack((img,img,img))
Мой код выполняется, и я не получаю ошибок.К сожалению, я не вижу ограничивающих рамок вокруг своих объектов.
Поэтому мои вопросы:
- Ожидается ли такое поведение?(Я предполагаю, что, поскольку фигуры все еще присутствуют на изображении, сработают верхние свертки NN, то есть это не будет существенно отличаться)
- Если такое поведение ожидается, что бы я тогдаделать?я должен использовать другую модель?