Привет! Я хочу улучшить свою производительность с помощью pytesseract при распознавании ди git.
Я беру свое необработанное изображение и делю его на части, которые выглядят так:
Размер может варьироваться.
К этому я применяю некоторые методы предварительной обработки, например
image = cv2.imread(im, cv2.IMREAD_GRAYSCALE)
image = cv2.GaussianBlur(image, (1, 1), 0)
kernel = np.ones((5, 5), np.uint8)
result_img = cv2.blur(img, (2, 2), 0)
result_img = cv2.dilate(result_img, kernel, iterations=1)
result_img = cv2.erode(result_img, kernel, iterations=1)
, и я получаю это
Затем я передаю это Pytesseract:
num = pytesseract.image_to_string(result_img, lang='eng',
config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')
Однако это не достаточно хорошо для меня и часто ошибается цифрами.
Я ищу способы улучшения, Я пытался сохранить это минимальным и самодостаточным, но дайте мне знать, если я не был ясен, и я уточню.
Спасибо.