У меня есть эта картинка:
![pic_to_be_cropped](https://i.stack.imgur.com/KEu8J.jpg)
У меня есть следующие относительные координаты:
[[0.6625, 0.6035714285714285], [0.7224999999999999, 0.6035714285714285], [0.7224999999999999, 0.6571428571428571], [0.6625, 0.6571428571428571], [0.6625, 0.6035714285714285]]
(однако я не понимаю, почему здесь 5 значений вместо обычных 4 и что они означают)
Моя попытка с scikit-image
, которая показывает всю картинку вместо обрезки:
import numpy as np
from skimage import io, draw
img = io.imread(pic)
vals = [[0.6625, 0.6035714285714285], [0.7224999999999999, 0.6035714285714285], [0.7224999999999999, 0.6571428571428571], [0.6625, 0.6571428571428571], [0.6625, 0.6035714285714285]]
vertices = np.asarray(test_vals)
rows, cols = draw.polygon(vertices[:, 0], vertices[:, 1])
crop = img.copy()
crop[:, :, -1] = 0
crop[rows, cols, -1] = 255
io.imshow(crop)
io.show()
# shows whole pic instead of cropping
Моя попытка с opencv
дает ошибки, потому что координаты в формате с плавающей точкой:
import cv2 as cv
vals = [[0.6625, 0.6035714285714285], [0.7224999999999999, 0.6035714285714285], [0.7224999999999999, 0.6571428571428571], [0.6625, 0.6571428571428571], [0.6625, 0.6035714285714285]]
x = vals[0][0]
y = vals[0][1]
width = vals[1][0] - x
height = vals[2][1] - y
img = cv.imread(pic)
crop_img = img[y:y+height, x:x+width]
cv.imshow("cropped", crop_img)
cv.waitKey(0)
# TypeError: slice indices must be integers or None or have an __index__ method
Как обрезать номер автомобиля на этой картинке, учитывая его относительные координаты bbox?
Я не ограничен какой-либо структурой, поэтому, если вы считаете, что TF или что-то еще может помочь - пожалуйста, предложите.