Я пытаюсь распознать капчу в текст.
Эта капча не очень сложная. (как я думаю).
Я открываю изображение и конвертирую его с помощью OpenCV, чтобы его было легко распознать.
Я покажу вам пример.
Пример капчи
После OpenCV Catpcha
image = cv2.imread(filename)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
gray = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv2.imwrite('OPENCV.png', gray)
# Get Text From Image
pytesseract.image_to_string(Image.open('OPENCV.png'), lang='eng', config="-c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ --psm 8")
Все просто. Но результат «PLLY2», но я хочу «PLLVI2» ИЛИ «PLLV12».
Есть ли какой-либо вариант или другой способ, которым я могу воспользоваться, чтобы добиться большей точности?
Я использую один вариант слова «psm 8» Я пытался найти, чтобы тессеракт находил фиксированное количество символов, но это невозможно.
Я буду очень признателен, если вы дадите мне только подсказку. Большое спасибо за чтение этого вопроса.