Я пытался распознать некоторые числовые значения c в документе и использовал для этого тот же pytesseract. Я хочу избежать вывоза мусора, поэтому я устанавливаю порог для оценки доверия. Информация исправляется, но достоверность остается на нуле даже при очень четко видимых значениях. Я хочу понять, что означает этот показатель доверия. Я использую конфигурацию "--psm 13 - c tessedit_char_whitelist = 0123456789" и метод image_to_data.
Результат выглядит так
['', '', '', '', '1205429'] ['-1', '-1', '-1', '-1', 0]