Читать △ как минус - PullRequest
       104

Читать △ как минус

0 голосов
/ 25 февраля 2020

△ означает минус ('-') как бизнес-правило. Как я могу прочитать следующие изображения, как ожидалось.

  • Входное изображение 1 (ожидаемое значение -74,523)

enter image description here

  • Исходное изображение 2 (ожидаемое значение -1 794 306)

enter image description here

  • Фактический результат
$ tesseract 1.png stdout -l eng --psm 4
£74 523

$ tesseract 2.png stdout -l eng --psm 4
a 1,794,306
  • Версия
$ tesseract -v
tesseract 4.1.1-rc2-22-g08899

В настоящее время не числовое значение c программно преобразуется в '-'. Но это не всегда работает, как показано ниже.

// Example. △ is read as '4'
tesseract x.png stdout -l eng --psm 4
474 523

1 Ответ

0 голосов
/ 26 февраля 2020

OpenCV имеет функцию поиска и замены изображения, как показано ниже.

  • Поиск изображения

enter image description here

  • Вход

enter image description here

  • Выход

enter image description here

  • Код
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img_rgb = cv.imread('images/input.png')
img_gray = cv.cvtColor(img_rgb, cv.COLOR_BGR2GRAY)
template = cv.imread('images/minus.png', 0)
w, h = template.shape[::-1]
res = cv.matchTemplate(img_gray, template, cv.TM_CCOEFF_NORMED)
threshold = 0.8
loc = np.where(res >= threshold)
for pt in zip(*loc[::-1]):
    cv.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (255, 255, 255), -1)
    cv.line(img_rgb, (pt[0], pt[1] + int(h / 2)),
            (pt[0] + w, pt[1] + int(h / 2)), (0, 0, 0), 2)
cv.imwrite('out/detected-minus.png', img_rgb)
  • Пробег
# tesseract out/detected-minus.png stdout -l eng --psm 4
— 2,196,193
  • Ссылка

https://docs.opencv.org/master/d4/dc6/tutorial_py_template_matching.html

...