OCR с использованием простой задачи Tesseract не удалось - PullRequest
0 голосов
/ 22 февраля 2020

Я делаю распознавание текста на отсканированных текстовых страницах и недавно начал пробовать Tesseract. Я понимаю, что иногда он сталкивается с некоторыми задачами, поэтому я создал область интереса в области, где мне не придется распознавать ни одного символа, например:

enter image description here

Я сделал некоторую очистку, чтобы получить этот символ "C", однако запустил картинку на Tesseract:

$ tesseract image.png stdout

Он все равно не может распознать его, и я получаю следующий вывод:

Warning. Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 275
Empty page!!
Estimating resolution as 275
Empty page!!

Есть ли причина, по которой он не справляется с этой, казалось бы, простой задачей?

1 Ответ

0 голосов
/ 23 февраля 2020

Да, это так. Причина в том, что вы не прочитали документацию . Сначала прочитайте документы, затем найдите пользовательский форум в tesseract, найдите SO, а затем задайте вопрос с описанием, какую технику вы уже попробовали.

...