Насколько я понимаю, у вас есть модель R-CNN, которая выводит обрезанные фрагменты входного изображения, и теперь вы хотите проследить эти выходные кадрирования до их координат в исходном изображении.
Что вы можетеДля этого просто используйте меру подобия патча, чтобы найти исходную позицию.Так как выходная обрезка должна выглядеть точно как на исходном изображении, просто используйте основанное на пикселях расстояние:
Найдитепоместите на изображении наименьшее расстояние (должно быть ноль), и из него вы можете найти желаемые координаты.
В питоне:
d_min = 10**6
crop_size = crop.shape
for x in range(org_image.shape[0]-crop_size[0]):
for y in range(org_image.shape[1]-crop_size[1]):
d = np.abs(np.sum(np.sum(org_image[x:x+crop_size[0],y:y+crop_size[0]]-crop)))
if d <= d_min:
d_min = d
coord = [x,y]
Однако , вашмодель должна иметь эту информацию доступной (в конце концов, она обрезает выходные данные на основе некоторых координат).Возможно, если вы добавите некоторую информацию о вашей реализации.