Обучение нейронной сети - PullRequest
       16

Обучение нейронной сети

4 голосов
/ 03 сентября 2010

Я пытаюсь распознать картинки по каждой цифре. Я удалил все, кроме цифры, так что почти нет шума, кроме того, что цифра размещена по-разному на фотографиях. Я использую графический интерфейс Neuroph для распознавания образов и у меня есть вопросы по поводу тренировок.

Кажется, чем больше разрешение, которое я использую для фотографий, тем хуже становится тренировка. Почему это? В моем тренировочном наборе 100 картинок. 10 каждой цифры. Это может быть слишком мало? Почему каждый тренинг, независимо от того, что я делаю, просто сходится к какому-то числу, обычно между 2-3 в общей сетевой ошибке.

Надеюсь, что вы можете помочь.

EDIT:

Вот изображение одного из тренингов alt text

Многому не научится

Ответы [ 2 ]

3 голосов
/ 03 сентября 2010

Увеличение информации является экспоненциальным!

Когда вы предоставляете изображения с более высоким разрешением, вы в конечном итоге предоставляете дополнительную информацию, которая должна быть оценена.

Если ваше разрешение составляет 10x10px, это приведет к 100 пикселям на изображение, и у вас будет 10 изображений на цифру, это 1000 пикселей на цифру .

Теперь, если вы удвоите разрешение до 20x20 пикселей, получится 400 пикселей на изображение или 4000 пикселей на цифру .

Другими словами: увеличение разрешения приводит к экспоненциальному увеличению для количества пикселей, которое вы должны оценивать для каждой цифры.

Добавление дополнительных (ненужных) пикселей увеличивает вероятность ошибок:

Обычно в машинном обучении картинки урезаны до минимума (как по размеру, так и по цвету), чтобы обеспечить как можно меньше места для ошибок. Когда у вас больше пикселей, алгоритм может узнать что-то о тех пикселях, которые совершенно не имеют отношения к фактической форме изображения.

0 голосов
/ 03 сентября 2010

С одной стороны, я должен повторить комментарий Лирика о том, что увеличение разрешения здесь не поможет.

Кроме того, 10 образцов каждой цифры, скорее всего, недостаточно для обучения вашей нейронной сети. 10 образцов цифр может даже не хватить обучающих данных, если вы обучаете человека , чтобы распознавать цифры на каком-то странном языке, который они не понимают. Посмотрите, добьетесь ли вы лучших результатов, увеличив размер ваших тренировочных данных примерно до 250-300 каждой цифры. Трудно сказать, сколько вам нужно, ничего не зная о вашей конкретной сети.

Я предполагаю, что вы увидите лучшие результаты с большим количеством обучающих данных и изображений с более низким разрешением.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...