Computer Vision - Используйте Image Matching или OCR, чтобы распознать страницу текстовой книги? - PullRequest
1 голос
/ 11 августа 2011

Я хочу быть в состоянии распознать, на какой странице только текстовой (без изображений) книги я нахожусь ... Какой наилучший подход:

Сначала я думал о каком-то сопоставлении изображений, но страницы всего учебника выглядят так похоже, не уверен, насколько хорошо это будет работать?

Вторая мысль была об использовании OCR ??

Любые идеи или предложения ... спасибо!

1 Ответ

2 голосов
/ 11 августа 2011

Я думаю, что сопоставление изображений действительно бесполезно в вашем случае ... Если вы хотите определить, на какой странице вы находитесь и что в книге есть пронумерованные страницы, вы можете использовать OCR, например, Tesseract.

  • 1) Найдите номер страницы (верхний левый угол, правый, нижний ..)
  • 2) Извлеките его (извлеките изображение, чтобы перейти к его декодированию)
  • (2bis) Предварительная обработкаimaget ...)
  • 3) Расшифруйте его (используйте Tesseract или другой OCR)

Если вы не хотите использовать OCR, вы можете посмотреть на Hu Moments, есличисла являются стандартными напечатанными числами, и их можно легко распознать.

...