Я постараюсь вам помочь.CNN (сверточные нейронные сети) работают с уникальными данными ввода, а не с матрицами (суперпиксель - это матрица).Итак, для этого вам нужно удалить каждый суперпиксель и сделать его собственным изображением.Итак, другими словами, если вы сегментируете свое изображение на 300 суперпикселей, после этого вам нужно создать 300 новых изображений, по одному на каждый суперпиксель.После этого печально известно, что каждое новое изображение, возможно, будет иметь разные размеры.Вы не можете так работать, потому что количество нейронов ввода в CNN не может измениться.Для этого вы можете централизовать каждое «новое изображение» в фоновом режиме NxN («N» должно быть достаточно, чтобы охватить все новые изображения).С централизованным суперпикселем (централизованные новые изображения) каждый пиксель будет вводить ваш CNN. Другими словами: 1) каждый централизованный суперпиксель будет вводиться по одному;2) Количество входов в CNN будет X * Y, где X является формой [0] централизованного суперпикселя, а Y - формой [1] централизованного суперпикселя;3) В то время как 300 суперпикселей централизованы, ваш CNN должен рассчитать выход для каждого из них.
Иллюстрация: https://imgur.com/k8pRDw7
Посмотрите иллюстрацию и удачи!:)