Я делаю распознавание текста на отсканированных текстовых страницах и недавно начал пробовать Tesseract. Я понимаю, что иногда он сталкивается с некоторыми задачами, поэтому я создал область интереса в области, где мне не придется распознавать ни одного символа, например:
Я сделал некоторую очистку, чтобы получить этот символ "C", однако запустил картинку на Tesseract:
$ tesseract image.png stdout
Он все равно не может распознать его, и я получаю следующий вывод:
Warning. Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 275
Empty page!!
Estimating resolution as 275
Empty page!!
Есть ли причина, по которой он не справляется с этой, казалось бы, простой задачей?