Есть ли ресурс, который объясняет ANN с простотой? - PullRequest
4 голосов
/ 25 августа 2011

Я видел, как многие сайты и блоги объясняют ANN (искусственные нейронные сети), но ни один из них не принимает во внимание пошаговую процедуру разработки базы для людей, которые мало знают о ANN, вместо этого они добавляют много математика, которая, к сожалению, для меня выглядит очень неуловимой. Существуют ли какие-либо веб-сайты / блоги, которые, например, обучают простой программе ANN, которая может распознавать сгенерированные компьютером цифры или что-то еще более простое, чем цифры?

1 Ответ

7 голосов
/ 25 августа 2011

Это мой аннотированный список лучших вводных (но полных) ресурсов по ANN (он же MLP ).

Записная книжка курса, Университет Willamette Этот ресурс содержит около 25-30 страниц (перемещайтесь по разделам, используя боковую панель в правом верхнем углу этой страницы, или нажимая далее или предыдущий внизу данной страницы). Я очень высоко ценю этот ресурс по двум причинам: (i) он содержит большое количество диаграмм и прекрасно интегрирует их с прозой; и (ii) это всеобъемлющая - архитектура сети, исчисление, лежащее в основе обратного распространения, выбор / повторение параметров обучения (импульс, скорость обучения) и т. д. Раздел о бэк-распространении Распространение (вычислительная и программная суть ANN / MLP) особенно хорошо - комбинируя прозу, сетевые диаграммы и реальные уравнения, оно тщательно объясняет каждый шаг в одной эпохе, которая включает в себя фазу обучения.

Рабочий класс разработчика IBM по нейронным сетям Этот класс Дэвида Мерца содержит рабочий код (python) и нетривиальный набор данных. За исключением первых нескольких абзацев, весь документ тесно следует коду и данным. Для меня это очень важно, потому что, если я не смогу это закодировать, я не думаю, что изучил это (это личный порог, он может не работать для других). Кроме того, акцент на код и взаимодействие этого кода с предоставленным набором данных делает обсуждение практически обоснованным. Наконец, авторы Дэвид Мерц и Эндрю Блэйс, очевидно, хорошо владеют предметом.

Generation5 Это самый базовый из трех, поэтому, возможно, тот, с которого стоит начать. Автор, очевидно, хорошо осведомлен о мелочах многослойных персептронов, но не требует от читателя таких знаний, т. Е. Обратное распространение объясняется как решение проблемы, основанное на здравом смысле, не прибегая к методам численного решения ( что часто встречается в MLP - «backprop решается с помощью градиентного спуска»). И, как и в первом упомянутом мною ресурсе, этот сильно зависит от диаграмм. Вместо данных (0 и 1) автор обсуждает структуру и функцию MLP в контексте простого сценария прогнозной аналитики, используя прозу, а не сводя проблему к числовым данным.

...