Дельта-правило обучения нейронной сети. Требуется объяснение алгоритма - PullRequest
1 голос
/ 01 февраля 2012

Я занимаюсь исследованием, проектом по нейронным сетям. Просто для себя. Ранее мне удалось понять алгоритм обучения Backpropagation, его основы, конечно, не всю историю. Но многие ресурсы ссылаются на дельта-правило, которое немного особенное. Мне уже удалось понять, что веса здесь изменяются один за другим. Но вопросов много. Не могли бы вы объяснить мне, как это работает, но более доступно, чем в Википедии. Просто алгоритм, но с четким объяснением шагов и «как это работает».


Кстати, есть производные, используемые для обучения. Не могу понять почему. И да, никакой специальный исходный код не требуется, если он не поможет.

Ответы [ 2 ]

3 голосов
/ 02 февраля 2012

Общая идея состоит в том, чтобы рассматривать нейронную сеть как функцию весов w_ij вместо входных данных: цель состоит в том, чтобы минимизировать ошибку между фактическими и целевыми выходами в вашем данные обучения. Для каждой (входной / выходной) обучающей пары дельта-правило определяет направление, которое необходимо настроить w_ij, чтобы уменьшить ошибку для этой обучающей пары. Делая короткие шаги для каждой тренировочной пары, вы находите направление, которое лучше всего подходит для всего тренировочного корпуса.

Представьте, что вы находитесь в центре огромного горного горнолыжного курорта, который слишком сложен, чтобы понять все сразу, но если ваша задача - добраться до самого дна, все, что вам нужно сделать, это спуститься вниз с того места, где вы Стоим. Это называется методом градиентного спуска : найдите самый крутой путь вниз по склону от того места, где вы находитесь, и сделайте шаг в этом направлении. Достаточно шагов увидим вас внизу; для нейронной сети «дно» - это нейронная сеть, которая лучше всего подходит для ваших тренировочных данных.

Вот почему вам нужна производная: производная - это наклон , и оказывается, что ее легко вычислить - это ваше дельта-правило. Производные используются для обучения, потому что именно так они получили правило.

Для пошагового вывода правила дельты, боюсь, я не могу улучшить статью википедии , на которую вы ссылаетесь.

2 голосов
/ 02 февраля 2012

Может быть, этот ресурс вам очень поможет (если вы его еще не обнаружили) http://www.ml -class.org Здесь вы можете найти идеальные короткие видеолекции (15мин или меньше), некоторые из них о математическом фоне и интуиции, которая стоит за алгоритмом обратного распространения.Надеюсь, это будет полезно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...