Метрики проверки набора странные - PullRequest
0 голосов
/ 30 января 2020

Я делаю проект об обработке изображений путем глубокого обучения, и вопрос, с которым я сталкиваюсь, заключается в том, что метрики набора данных проверки сильно отличаются от показателей набора данных обучения. Разница показана ниже. image1 Для верхнего графика (набор обучающих данных) зеленые, синие и красные линии представляют ms-ssim, потерю генератора и потерю дискриминатора соответственно. Для нижнего графика (набор данных проверки) синие, серые, оранжевые линии представляют ms-ssim, потерю генератора и потерю дискриминатора соответственно. Единственное различие между этими двумя наборами данных состоит в том, что набор проверки не обработан (1200 * 800), но обучающий набор обрезан (256 * 256).

Далее я пытаюсь обрезать набор проверки с той же настройкой. Так же, как я думаю, метрики двух наборов данных становятся похожими. Однако, поскольку реальные изображения (набор данных тестирования) не обрезаются, эти показатели кажутся бесполезными.

Мой вопрос:

  1. Почему «обрезка» может иметь такое значение?
  2. Как сделать метрики двух наборов одинаковыми без набора проверки обрезки?
  3. Похоже ли это на -подгонка?

1 Ответ

0 голосов
/ 30 января 2020

Было бы полезно узнать, какова точная задача. Что вы пытаетесь решить, как ваши данные выглядят ...

В общем, это действительно имеет значение. У вас есть исходный размер 1200x800 и вырежьте его до 256x256. Таким образом, в конце вы извлекли область 256x256 из изображения 1200x800. Что и где вы обрезаете, просто случайно или с какой-то логикой c?

Таким образом вы полностью меняете распределение данных. Необработанное изображение будет содержать гораздо больше информации. В зависимости от того, как выполняется обрезка, сеть может увидеть информацию, которую никогда не видела раньше. Вы также go от прямоугольного входа до прямоугольного angular один. Многие модели даже не работают на таких разных входных размерах.

Если вы можете тренироваться только на обрезанных изображениях, вам также нужно обрезать набор для проверки и тестирования, чтобы получить сопоставимые результаты.

Только на основании предоставленной информации это не выглядит чрезмерная подгонка больше похожа на проблему с большим смещением домена, вызванным обрезкой изображения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...