Question

Я использую Tesseract version = 'v5.0.0.20190526'. Я извлекаю текст из этого . Когда я использовал

pytesseract.image_to_data(img, output_type=Output.DICT)

Это чтение изображения по вертикали из-за режима psm по умолчанию, но там все символы правильно читаются.

Но когда я добавлю PSM.

d = pytesseract.image_to_data(img, output_type=Output.DICT,config='--psm 6')

читает изображение по горизонтали, как и должно, но теперь неправильно читает много символов, таких как «Примечание», «2017» и символы валюты под ним

В чем может быть проблема для этого?

Tesseract читает неправильный символ, если я меняю режим psm

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.