Различение обучения и запоминания в искусственных нейронных сетях - PullRequest
0 голосов
/ 01 ноября 2018

Есть ли хороший ресурс, который четко объясняет разницу между обучением и запоминанием искусственных нейронных сетей - гораздо лучше, если источник содержит математические объяснения и / или доказательства. Я просмотрел онлайн и литературу, но большинство из них просто демонстрируют это, используя примеры, такие как обнаружение или распознавание объектов. Например: это , это также это ... список довольно длинный. Я считаю, что этого недостаточно. Я знаю, что для некоторых этот вопрос может показаться немного расплывчатым, но существует ли такая вещь, как порог, за которым система просто запоминает или усвоила? Большое спасибо.

1 Ответ

0 голосов
/ 01 ноября 2018

Я не знаю ни о каком источнике доказательств, но нейронные сети по своей природе являются очень хорошими классификаторами для перегрузки или переобученности. Если вы используете более сложную сеть, чем та, которая вам нужна (и вы обычно не знаете, что это конечно) Вы, вероятно, перетренируете модель. Регуляризация и отсев используются для предотвращения или, по крайней мере, уменьшения переоснащения нейронных сетей.

когда ваша модель переопределяется, это означает, что она нашла шаблон только для конкретного распределения выборок, аналогичного тем, с которыми вы тренировались в вашей модели, и, следовательно, потеря способности обобщать для всех невидимых входных данных. это поведение называется запоминанием, запоминание также может происходить в тех случаях, когда ваши сэмплы / входы имеют порядок в них, но вы не хотите, чтобы модель изучала порядок, и нейронная сеть использует этот порядок для классификации сэмплов (например, входные данные сортируются от низкого до среднего) перетасовка данных является хорошим решением в этом вопросе.

Я только знаю, что вы можете узнать, запомнила ли модель поезд таким образом: точность обучения очень высока, может быть 100%, но точность теста намного ниже, а это много не имеет порогового значения, оно эмпирическое, для конкретной проблемы вы можете быть в порядке с точностью 75%, а для другой - даже на 95%.

...