Question

Я делаю распознавание текста на отсканированных текстовых страницах и недавно начал пробовать Tesseract. Я понимаю, что иногда он сталкивается с некоторыми задачами, поэтому я создал область интереса в области, где мне не придется распознавать ни одного символа, например:

Я сделал некоторую очистку, чтобы получить этот символ "C", однако запустил картинку на Tesseract:

$ tesseract image.png stdout

Он все равно не может распознать его, и я получаю следующий вывод:

Warning. Invalid resolution 0 dpi. Using 70 instead.
Estimating resolution as 275
Empty page!!
Estimating resolution as 275
Empty page!!

Есть ли причина, по которой он не справляется с этой, казалось бы, простой задачей?

user898678 · Answer 1 · 23 февраля 2020

Да, это так. Причина в том, что вы не прочитали документацию . Сначала прочитайте документы, затем найдите пользовательский форум в tesseract, найдите SO, а затем задайте вопрос с описанием, какую технику вы уже попробовали.

OCR с использованием простой задачи Tesseract не удалось

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

OCR с использованием простой задачи Tesseract не удалось

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы