Оператор Собеля 3x3 и градиент - PullRequest
1 голос
/ 06 августа 2009

Читая газету, я с трудом понимаю алгоритм, описанный:

Учитывая черно-белое цифровое изображение образца почерка, вырежьте один символ для анализа. Поскольку это может быть любой размер, алгоритм должен принять это во внимание (если это будет проще, мы можем предположить, что размер равен 2 ^ n x 2 ^ m).

Теперь, в описании состояния данного изображения мы преобразуем его в 512-битную функцию (512-битный хэш) следующим образом:

  1. (192 бита) вычисляет градиент изображения, сворачивая его с помощью оператора Собеля 3x3. Направление градиента на каждом ребре квантуется до 12 направлений.

  2. (192 бита) Генератор конструктивных элементов берет карту градиента и ищет в окрестности определенные комбинации значений градиента. (используется для вычисления 8 различных элементов, представляющих линии и углы на изображении)

  3. (128 бит) Генератор вогнутости использует 8-точечный звездный оператор, чтобы находить грубые вогнутости в 4 направлениях, отверстиях и ходах шкалы запаздывания.

Карты объектов изображения нормализованы с помощью сетки 4x4.

Пока что я борюсь с тем, как сделать произвольное изображение, разбить его на 16 секций и использовать оператор Собеля 3x3, чтобы получить 12 битов для каждой секции. (Но если у вас есть понимание других частей, не стесняйтесь комментировать:)

Ответы [ 2 ]

3 голосов
/ 03 ноября 2009

Я борюсь с той же статьей Srihari et al. (2002) для моего доктора философии Тезис. Я бы сказал, что этот текст не очень конкретен, но авторы обращаются к техническому отчету (CEDAR-TR-01-1) для более подробной информации Этот отчет, кажется, не доступен в Интернете, поэтому я предлагаю связаться с авторами по электронной почте и попросить этот отчет. Если что-то неясно, вы также можете попросить разъяснений.

2 голосов
/ 18 июля 2014

Я вижу, что вопрос очень старый, но, возможно, он может кому-то помочь - вы применяете операторы sobel для определения горизонтальных и вертикальных краев на изображении. Из результата вы можете рассчитать векторы направления изображения для каждой точки изображения. В вашем случае вам нужно сопоставить эти векторы с 12 направлениями. Затем, в вашем случае, вы делите изображение на 4x4 изображения (16 секций) и вычисляете интенсивность каждого направления в каждой секции. Это дает вам 12 * 16 = 192 функции. При необходимости могу дать более подробное объяснение.

...