Нейросетевой выходной слой для многократного распознавания образов - PullRequest
2 голосов
/ 06 января 2011

Предположим, у меня есть метод или другая нейронная сеть для правильного определения шаблона на изображении.Как мне спроектировать нейронную сеть, в которой на изображении несколько шаблонов?

Скажите, что на изображении обнаруживаются Х-шаблоны, какой будет наилучший подход?Значения нейронов выходного слоя AFAIK должны быть [-1,1].Как бы я узнал, если распознано количество шаблонов X?Означает ли это, что я должен установить жестко заданное ограничение на количество шаблонов, которые он может распознать (поскольку число выходных нейронов фиксировано)?

Ответы [ 3 ]

0 голосов
/ 16 января 2011

, чтобы сделать это, используйте сначала hopfild net.at в равных окнах, извлеките свою цель и сохраните в своей сети.затем с помощью простого алгоритмического поиска по вашему изображению и в любое время сравните сим сети с вашей целью, и для любой цели используйте отдельный массив для сохранения результата. В конце извлеките ближайший шаблон в каждом массиве. Вы можете использовать некоторое изображениеобработка в вашем исходном изображении перед началом.

0 голосов
/ 20 января 2011

Да, это может быть сделано нейронной сетью.Я думаю, что наиболее практичные решения включают применение нейронной сети к окну, сканирующему изображение.Множественные попадания из нейронной сети означают наличие нескольких целевых объектов на изображении.

Кстати, нейронные сети не обязательно должны находиться в диапазоне -1 .. 1.

0 голосов
/ 06 января 2011

Вот пример использования распознавания лиц в качестве примера.Эта ссылка Face Detection Face на Github описана для обнаружения шаблона множественных чисел (то есть лиц) с использованием классификатора Хаара.Если вы читаете в разделе Реализация , в нем говорится, что алгоритм использует параметры scaleOption и templateSizeOption (среди прочих) для управления количеством лиц, обнаруженных на изображении.Похоже, вам следует искать объекты в подпространствах или окнах данного изображения (возможно, даже в местах, которые перекрываются).

scaleOption - этот параметр используется для указания скорости вкакие особенности haar, используемые для обнаружения лица, будут масштабированы.Параметр меньшего масштаба означает, что будет обнаружено больше лиц, в то время как параметр большего масштаба будет выполнять более быстрое обнаружение, но может пропустить некоторые лица из входного изображения.Значение масштаба по умолчанию равно 1,1, что определяет увеличение размера объектов на 10% на каждом шаге.

templateSizeOption - используется для указания минимальной области, в которой следует искать объект.лицо.Если мы хотим обнаруживать людей из изображений крупным планом, размер должен быть более 40 пикселей, в противном случае для обнаружения большого числа лиц достаточно 25 пикселов региона (что является значением по умолчанию).

...