Нарезка больших разнородных изображений с двоичными аннотациями - PullRequest
1 голос
/ 05 июля 2019

Я работаю над проектом глубокого обучения и столкнулся с проблемой.Изображения, которые я использую, очень большие и очень подробные.Они также содержат огромное количество необходимой визуальной информации, поэтому трудно понизить разрешение.Я справился с этим, нарезав свои изображения на «плитки» с разрешением 512 x 512. Для каждого изображения есть несколько тысяч плиток.

Вот проблема: аннотации являются двоичными, а изображения разнородными.Таким образом, аннотация может быть применена к плитке изображения, которая не влияет на фактическую классификацию.Как можно уменьшить влияние плиток, которые помечены «неправильно».

Одна мысль состоит в том, чтобы кластеризовать плитки с чем-то вроде графика t-SNE и сравнить соотношение двоичных аннотаций для разных регионов (или 'классы).Затем я могу назначить веса изображениям в зависимости от того, где они расположены, а затем использовать их в качестве дополнительного слоя в моих тренировках.Очень новичок во всем этом, поэтому не удивлюсь, если это ужасная идея!Просто подумал, что мне понадобится удар.

Для фона я использую трансферное обучение в Inception v3.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...