Python-код для этой конфигурации выглядит так:
import pytesseract
import cv2
img = cv2.imread("path to some image")
pytesseract.image_to_string(img, config="-c tessedit"
"_char_whitelist=abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"
" --psm 10"
" -l osd"
" "))
флаг --psm
определяет режим сегментации страницы.
согласно документации по тессеракту, 10
означает:
Рассматривать изображение как один символ.
так, чтобы распознать один символ, вам просто нужно использовать: --psm 10
флаг.