Question

У меня есть вопрос о некоторой терминологии, когда речь идет о программном обеспечении для оптического распознавания символов, в частности о механизме распознавания текста Tesseract.

Я читаю статью о механизме распознавания текста Tesseract, и в ней часто упоминается то, что называется * 1003. * и я не совсем уверен, что это значит. Я предполагаю, что высота - это пространство, которое занимает строка текста, но это не имеет смысла в контексте статьи, которую я читаю.

Это предложение из статьи, в которой используется эта формулировка:

Капли организованы в текстовые строки, а линии и регионы анализируются на фиксированный или пропорциональный текст.

Я искал в Интернете какое-то определение этого, но большинство статьи на OCR просто используют его без объяснения причин. Я предполагаю, что это означает, что это довольно простой / общий термин.

Если кому-то все равно, статья, которую я читаю, называется «Обзор механизма распознавания текста Тессеракта», написанной Рэем Смитом.

Aaron Jones · Answer 1 · 18 марта 2020

При первой попытке найти текст на изображении, Tesseract определит возможные области, где текст присутствует с каплями. Как только возможные области, в которых может присутствовать текст, были идентифицированы, Tesseract затем проверяет, содержат ли эти области «фиксированный шаг». По сути, это означает, что он пытается выяснить, действительно ли найденные ранее области содержат текст. Фиксированная высота - это различные типы векторов, которые используются для создания определенной буквы или слова, и Тессеракт ищет их для анализа того, какую букву или слово они видят на изображении.

Тессеракт OCR Pitch Text

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Тессеракт OCR Pitch Text

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы