Как обучить сверточную нейронную сеть с отрицательными и положительными элементами в качестве входных данных первого слоя? - PullRequest
0 голосов
/ 21 ноября 2018

Мне просто любопытно, почему я должен масштабировать набор тестов на тестовом наборе, а не на тренировочном наборе, когда я тренирую модель, например, на CNN ?!Или я не прав?И мне все еще нужно масштабировать его на тренировочном наборе.Кроме того, я могу обучить набор данных в CNN, который содержит положительные и отрицательные элементы как первый вход сети?Любые ответы со ссылкой будут действительно оценены.

Ответы [ 3 ]

0 голосов
/ 21 ноября 2018

У нас обычно есть 3 типа наборов данных для обучения модели,

  1. Набор обучающих данных
  2. Набор проверочных данных
  3. Набор тестовых данных

Набор обучающих данных

Это должен быть равномерно распределенный набор данных, который охватывает все виды данных.Если ваш поезд имеет больше эпох , модель привыкнет к набору обучающих данных и даст только надлежащий правильный прогноз на наборе обучающих данных, и это называется Overfitting .Единственный способ сохранить проверку на переоснащение состоит в том, чтобы иметь другие наборы данных, на которых модель никогда не обучалась.

Валидационный набор данных

Для этого можно использовать гиперпараметры модели точной настройки.

Набор тестовых данных

Этот набор данных, на котором модель не была обучена, никогда не принимал участие в определении гиперпараметров и даст представление о том, как модельвыполняет.

0 голосов
/ 21 ноября 2018

Если используются масштабирование и нормализация, тестовый набор должен использовать те же параметры, которые использовались во время обучения.Хороший ответ, который связан с этим: https://datascience.stackexchange.com/questions/27615/should-we-apply-normalization-to-test-data-as-well

Кроме того, некоторые модели требуют нормализации, а другие - нет.Архитектуры нейронной сети обычно устойчивы и могут не нуждаться в нормализации.

0 голосов
/ 21 ноября 2018

Масштабирование данных зависит от требований, а также от фида / данных, которые вы получили.Тестовые данные масштабируются только с Тестовыми данными, потому что Тестовые данные не имеют целевой переменной (на одну функцию меньше в Тестовых данных).Если мы масштабируем наши обучающие данные новыми тестовыми данными, наша модель не сможет соотноситься с какой-либо целевой переменной и, следовательно, не сможет учиться.Таким образом, ключевым отличием является наличие целевой переменной.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...