Pytesseract не распознает числа, несмотря на попытку каждого -psm - PullRequest
0 голосов
/ 05 мая 2020

Я пытался получить некоторые числа из этого изображения , но pytesseract дает мне только случайные буквы. Я пробовал много опций -psm, но, похоже, они не работают. Вот код, который я использую:

from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open("Test.png"), config="--psm 6"))

Что я могу сделать, чтобы сделать его более успешным?

1 Ответ

1 голос
/ 06 мая 2020

Попробуйте этот код.

import cv2
import pytesseract

img = cv2.imread("vuK1z.png", 0)
thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)[1]
custom_config = r'-l eng --oem 3 --psm 6 '
text = pytesseract.image_to_string(thresh, config=custom_config)
print(text)

Результат

550,000
...