Я работаю над проектом глубокого обучения и столкнулся с проблемой.Изображения, которые я использую, очень большие и очень подробные.Они также содержат огромное количество необходимой визуальной информации, поэтому трудно понизить разрешение.Я справился с этим, нарезав свои изображения на «плитки» с разрешением 512 x 512. Для каждого изображения есть несколько тысяч плиток.
Вот проблема: аннотации являются двоичными, а изображения разнородными.Таким образом, аннотация может быть применена к плитке изображения, которая не влияет на фактическую классификацию.Как можно уменьшить влияние плиток, которые помечены «неправильно».
Одна мысль состоит в том, чтобы кластеризовать плитки с чем-то вроде графика t-SNE и сравнить соотношение двоичных аннотаций для разных регионов (или 'классы).Затем я могу назначить веса изображениям в зависимости от того, где они расположены, а затем использовать их в качестве дополнительного слоя в моих тренировках.Очень новичок во всем этом, поэтому не удивлюсь, если это ужасная идея!Просто подумал, что мне понадобится удар.
Для фона я использую трансферное обучение в Inception v3.