Как мне сегментировать связанные символы в этом случае? - PullRequest
1 голос
/ 20 апреля 2019

Похоже, мне нужен совет по сегментации подключенных символов (см. Изображение ниже).

Как видите, C и U, а также 4,9 и 9 связаны, и поэтому, когда я пытаюсь нарисовать контуры, они объединяются в один блок.К сожалению, есть много таких проблемных изображений, поэтому я думаю, что мне нужно найти какое-то решение.

Я пытался использовать различные морфологические преобразования (эрозия, расширение, раскрытие), но это не решает проблему.

Заранее спасибо за любые рекомендации.

enter image description here

1 Ответ

1 голос
/ 21 апреля 2019

Мне кажется, что лучшим решением будет работа по предварительной обработке, если есть такая возможность.

В противном случае, вы можете попробовать методы машинного обучения. Вы можете черпать вдохновение из алгоритмов Альт-Джонса или Гистограмм ориентированных градиентов + SVM (хотя эти алгоритмы решают проблему, которая отличается от оптического распознавания символов, у меня было много идей из них ). Другими словами, попробуйте «сдвинуть» окно по горизонтали с заданным соотношением сторон и распознать символы. Но проблема может заключаться в том, что вам понадобится обучить модель, которая может потребовать много данных.

Как я уже говорил ранее, возможно, будет хорошей идеей пересмотреть этап предварительной обработки изображения. Кстати, кажется, что в случае «C» и «U», эрозия может помочь.

Удачи!:)

...