Читать текст с картинки - PullRequest
       10

Читать текст с картинки

0 голосов
/ 02 февраля 2020

У меня есть такая фотография:

captcha

Я пытался прочитать ее с pytesseract в Python:

from PIL import Image
import pytesseract
import numpy 
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
im = Image.open("11.jpg")
text = pytesseract.image_to_string(im,lang = "eng")
print(text)

, но pytesseract не могу прочитать. Я тоже пытался opencv, но не могу найти решение.

Ответы [ 2 ]

1 голос
/ 04 февраля 2020

Перед применением оптического распознавания текста к изображению необходимо предварительно обработать изображение. Простой метод предварительной обработки - увеличить изображение, получить двоичное изображение, используя порог Оцу, выполнить морфологические операции, а затем распознать изображение.

Увеличение, размытие по Гауссу и порог Оцу

enter image description here

Открытие морфа

enter image description here

Morph close

enter image description here

Инвертировать, применить небольшое размытие и OCR

enter image description here

Результат от Pytesseract OCR image_to_string с использованием опции конфигурации --psm 6 для обработки изображения как одного блока текста.

xc2kc2

Код

import cv2
import pytesseract
import imutils

pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"

# Resize, grayscale, Gaussian blur, Otsu's threshold
image = cv2.imread('1.jpg')
image = imutils.resize(image, width=400)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray, (5,5), 0)
thresh = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)[1]

# Perform morphological operations
kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=1)
close = cv2.morphologyEx(opening, cv2.MORPH_CLOSE, kernel, iterations=3)

# Invert, Blur, and perform text extraction
invert = 255 - cv2.GaussianBlur(close, (3,3), 0)
data = pytesseract.image_to_string(invert, lang='eng',config='--psm 6')
print(data)

cv2.imshow('thresh', thresh)
cv2.imshow('opening', opening)
cv2.imshow('close', close)
cv2.imshow('invert', invert)
cv2.waitKey()
0 голосов
/ 02 февраля 2020

В этом блоге есть пост, в котором блоггер упоминает о попытке использовать tesseract, gocr и ocrad для чтения текста с картинки.

Ключевым шагом является очистка изображения. прежде чем пытаться это прочитать. В примере, приведенном на этом сайте, используется простой пороговый фильтр, но поскольку ваше изображение в цвете, оно может работать не так хорошо.

Вам следует поэкспериментировать с различными методами обработки изображений, чтобы проверить, можно ли их очистить. достаточно, чтобы распознать текст.

Сказав выше, я повторю комментарий @ SiHa и предположу, что эта деятельность неэтична. Попытка подорвать защиту CAPTCHA показывает отсутствие уважения к владельцу сервера, независимо от того, делают ли они это для защиты своей пропускной способности или своего бизнеса.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...