Почему преобразование Фурье можно использовать для распознавания изображений при чувствительности к шумам? - PullRequest
5 голосов
/ 05 апреля 2010

Как мы знаем, преобразование Фурье чувствительно к шумам (таким как соль и перец),

как это все еще можно использовать для распознавания изображений?

Здесь есть эксперт по FT?

Ответы [ 3 ]

7 голосов
/ 21 мая 2010

Обновление, чтобы фактически ответить на вопрос, который вы задали ... :) Предварительно обработайте изображение нелинейным фильтром, чтобы подавить шум соли и перца. Медианный фильтр может быть?

Далее следует базовый урок по БПФ на согласованных фильтрах ...

Классическим способом обнаружения меньшего изображения на большом изображении является согласованный фильтр . По сути, это включает в себя взаимную корреляцию большего изображения с меньшим (вещь, которую вы пытаетесь распознать).

  1. Для каждой позиции в увеличенном изображении
  2. Наложение меньшего изображения на увеличенное изображение
  3. Умножить все соответствующие пиксели
  4. Сумма результатов
  5. Поместите эту сумму в эту позицию на отфильтрованном изображении

Подобранный фильтр является оптимальным, если единственным шумом на большом изображении является белый шум.

Это вычислительно медленный процесс, но его можно разложить на операции БПФ (быстрого преобразования Фурье), которые намного эффективнее. Существуют гораздо более сложные подходы к сопоставлению изображений, которые гораздо лучше переносят шум других типов, чем фильтр согласования. Но немногие так эффективны, как согласованный фильтр, реализованный с использованием БПФ.

Google "фильтр соответствия", "взаимная корреляция" и "фильтр свертки" для более.

Например, вот одно краткое объяснение, которое также указывает на недостатки этого очень старого школьного подхода к сопоставлению изображений: http://www.dspguide.com/ch24/6.htm

1 голос
/ 06 апреля 2010

Не совсем точно, что вы спрашиваете. Если вы спрашиваете о том, как FFT можно использовать для распознавания изображений, вот несколько соображений.

БПФ может использоваться для выполнения «классификации» изображения. Его нельзя использовать для распознавания разных лиц или объектов, но его можно использовать для классификации типа изображения. БПФ рассчитывает пространственную частоту изображения. Так, например, естественная сцена, лицо, городская сцена и т. Д. Будут иметь разные БПФ. Поэтому вы можете классифицировать изображение или даже в пределах изображения (например, аэрофотоснимок для классификации местности).

Кроме того, FFT используется в предварительной обработке для распознавания изображений. Его можно использовать для оптического распознавания текста, чтобы повернуть отсканированное изображение в правильную ориентацию. БПФ печатного текста имеет сильную ориентацию. То же самое для проверки деталей в промышленной автоматизации.

0 голосов
/ 06 апреля 2010

Я не думаю, что вы найдете много методов, которые используют преобразования Фурье для распознавания изображений.

В случае шума соли и перца его можно считать высокочастотным шумом, и, таким образом, вы можете отфильтровать низкочастотный фильтр БПФ перед сравнением с целевым изображением. Я полагаю, что это сработает, но разные изображения, которые в некоторой степени похожи (как и фотографии, сделанные снаружи), будут регистрироваться как одно и то же изображение.

...