Pytesseract - Плохие результаты - PullRequest
0 голосов
/ 18 июня 2020

Я пытаюсь взломать антибота в сетевой игре, в которую я играю. Я написал бота в Python / Selenium, и теперь я пытаюсь написать функцию «взломать антибот».

Я сделал снимок экрана с антиботом (потому что это php - файл, который изменяется при перезагрузке).

Вот четыре разных изображения антибота:

enter image description here enter image description here enter image description here enter image description here

Вот мой код:

output = pytesseract.image_to_string(PIL.Image.open('ab1.png').convert("RGB"))
output2 = pytesseract.image_to_string(PIL.Image.open('ab2.png').convert("RGB"))
output3 = pytesseract.image_to_string(PIL.Image.open('ab3.png').convert("RGB"))
output4 = pytesseract.image_to_string(PIL.Image.open('ab4.png').convert("RGB"))
print (output, output2, output3, output4)

И вывод:

i A

Есть ли способ получить лучшие результаты с помощью Tesseract? Спасибо за любую помощь.

1 Ответ

0 голосов
/ 22 июня 2020
def test1():
    # Grayscale, Gaussian blur, Otsu's threshold
    filename = ("teu.png")
    image = cv2.imread(filename, cv2.IMREAD_UNCHANGED)

    blur = cv2.GaussianBlur(gray, (1,1), 0)
    kernel = np.ones((1,1),np.float32)/25
    opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, blur, iterations=1)

    # Perform text extraction
    data = pytesseract.image_to_string(opening, lang='eng', config='--psm 13')
    print(data)

    cv2.imshow('opening', opening)
    #cv2.imwrite(filename, opening)
    cv2.waitKey()

test1()

Хорошо, я зашел так далеко. Текст черным цветом на белом фоне. Но как сделать так, чтобы текст стал более читабельным?

Результат выглядит так:

введите описание изображения здесь

...