Собственные преобразования: почему высокие собственные значения указывают на области текста? - PullRequest
2 голосов
/ 19 апреля 2011

Во многих статьях упоминается, что в текстовых областях возникают высокие собственные значения, рассчитанные по значениям пикселей серого уровня после того, как изображение было разделено на блоки матриц mxm. Кроме того, собственные значения являются мерой шероховатости текстуры изображения.

Как это связано с получением текста? Текстовые области обычно имеют два цвета, фон и передний план с штрихами букв одинакового цвета. Где эта шероховатость - там может быть много других функций, которые будут более грубыми и вызовут высокие собственные значения. Может ли кто-нибудь указать, где взять математику, которая связывает эти вещи?

редактирует: В нескольких статьях упоминаются собственные значения в контексте обнаружения текста в естественных сценах.

  1. Платформа для обнаружения и отслеживания текста в режиме реального времени использует Eigentransform для изображения в оттенках серого.

  2. Подход к обнаружению текста в видео на основе собственных значений упоминает вычисление собственных значений из ковариационной матрицы градиентного изображения.

1 Ответ

1 голос
/ 20 апреля 2011

Просто ориентация, чтобы вы могли начать читать и в конечном итоге лучше нацелить свой следующий вопрос:

Вы говорите о Анализ основных компонентов

Здесь у вас есть пример приложения:

enter image description here

HTH, чтобы начать работу.

...