Я тестирую Pytesseract и использую его для извлечения цифр, подобных приведенной ниже.
Изображение довольно приличного качества (200 точек на дюйм). Однако, когда я запускаю pytesseract, он дает мне результат 456- / 8-0000 , где цифра 7 ошибочно распознается как '/'. Хотя «/» явно имеет некоторое сходство с цифрой 7, учитывая высокое качество изображения, я все равно удивлен этим.
Я пробовал оба
pytesseract.image_to_string(img)
и
pytesseract.image_to_string(img, lang='eng', config='--psm 13 --oem 2 -c tessedit_char_whitelist=0123456789-')
оба дали один и тот же результат.
Любой указатель на то, как повысить точность распознавания, был бы великолепен. Спасибо!