Это мой аннотированный список лучших вводных (но полных) ресурсов по ANN (он же MLP ).
Записная книжка курса, Университет Willamette Этот ресурс содержит около 25-30 страниц (перемещайтесь по разделам, используя боковую панель в правом верхнем углу этой страницы, или нажимая далее или предыдущий внизу данной страницы). Я очень высоко ценю этот ресурс по двум причинам: (i) он содержит большое количество диаграмм и прекрасно интегрирует их с прозой; и (ii) это всеобъемлющая - архитектура сети, исчисление, лежащее в основе обратного распространения, выбор / повторение параметров обучения (импульс, скорость обучения) и т. д. Раздел о бэк-распространении Распространение (вычислительная и программная суть ANN / MLP) особенно хорошо - комбинируя прозу, сетевые диаграммы и реальные уравнения, оно тщательно объясняет каждый шаг в одной эпохе, которая включает в себя фазу обучения.
Рабочий класс разработчика IBM по нейронным сетям Этот класс Дэвида Мерца содержит рабочий код (python) и нетривиальный набор данных. За исключением первых нескольких абзацев, весь документ тесно следует коду и данным. Для меня это очень важно, потому что, если я не смогу это закодировать, я не думаю, что изучил это (это личный порог, он может не работать для других). Кроме того, акцент на код и взаимодействие этого кода с предоставленным набором данных делает обсуждение практически обоснованным. Наконец, авторы Дэвид Мерц и Эндрю Блэйс, очевидно, хорошо владеют предметом.
Generation5 Это самый базовый из трех, поэтому, возможно, тот, с которого стоит начать. Автор, очевидно, хорошо осведомлен о мелочах многослойных персептронов, но не требует от читателя таких знаний, т. Е. Обратное распространение объясняется как решение проблемы, основанное на здравом смысле, не прибегая к методам численного решения ( что часто встречается в MLP - «backprop решается с помощью градиентного спуска»). И, как и в первом упомянутом мною ресурсе, этот сильно зависит от диаграмм. Вместо данных (0 и 1) автор обсуждает структуру и функцию MLP в контексте простого сценария прогнозной аналитики, используя прозу, а не сводя проблему к числовым данным.