Тессеракт OCR Pitch Text - PullRequest
       24

Тессеракт OCR Pitch Text

0 голосов
/ 18 марта 2020

У меня есть вопрос о некоторой терминологии, когда речь идет о программном обеспечении для оптического распознавания символов, в частности о механизме распознавания текста Tesseract.

Я читаю статью о механизме распознавания текста Tesseract, и в ней часто упоминается то, что называется * 1003. * и я не совсем уверен, что это значит. Я предполагаю, что высота - это пространство, которое занимает строка текста, но это не имеет смысла в контексте статьи, которую я читаю.

Это предложение из статьи, в которой используется эта формулировка:

Капли организованы в текстовые строки, а линии и регионы анализируются на фиксированный или пропорциональный текст.

Я искал в Интернете какое-то определение этого, но большинство статьи на OCR просто используют его без объяснения причин. Я предполагаю, что это означает, что это довольно простой / общий термин.

Если кому-то все равно, статья, которую я читаю, называется «Обзор механизма распознавания текста Тессеракта», написанной Рэем Смитом.

1 Ответ

1 голос
/ 18 марта 2020

При первой попытке найти текст на изображении, Tesseract определит возможные области, где текст присутствует с каплями. Как только возможные области, в которых может присутствовать текст, были идентифицированы, Tesseract затем проверяет, содержат ли эти области «фиксированный шаг». По сути, это означает, что он пытается выяснить, действительно ли найденные ранее области содержат текст. Фиксированная высота - это различные типы векторов, которые используются для создания определенной буквы или слова, и Тессеракт ищет их для анализа того, какую букву или слово они видят на изображении.

...