Я пытаюсь извлечь данные из изображения, используя pytesseract . Этот модуль имеет методы image_to_data , image_to_osd . Эти два метода предоставляют много информации (TextLineOrder, WritingDirection, ScriptDetection, Orientation et c ...) в качестве выходных данных.
Ниже изображения выводится метод image_to_data . что означают значения этих столбцов (level, block_num, par_num, line_num, word_num)?
Вывод image_to_osd выглядит как ниже. Что означает каждый термин в этом слове?
Номер страницы: 0 Ориентация в градусах: 0 Поворот: 0 Доверительность ориентации: 16.47 Сценарий: латинский Скорее всего сценарий: 4.00
Я ссылался на документы, но сделал не получить никакой информации относительно этих параметров.