Как читать числа (из определенных мест) с изображения (используя Python или веб-сайт, совместимый с автоматизацией)? - PullRequest
0 голосов
/ 17 июня 2020

Пожалуйста, найдите здесь ссылку на рассматриваемое изображение. 1 Я пробовал использовать PyTesseract для достижения поставленной цели. Хотя он хорошо работает для извлечения слов, он не выбирает числа с какой-либо степенью приемлемой точности. Фактически, он вообще даже не выбирает нужные мне числа. Я намереваюсь разработать программу, которая собирает числа из четырех конкретных мест на изображении и сохраняет их в переменной структурированных данных (list / dictionary / et c.), И поскольку мне нужно сделать это для хороших 2500-с лишним снимков экрана с помощью этой программы я не могу вручную выбрать нужные мне числа, даже если она начинает их правильно читать. Следующий результат был возвращен при использовании PyTesseract (для изображения, о котором говорилось выше).

`Activities Boyer STA

Candle Version 4.1-9 IUAC, N.Delhi - BUILD (Tuesday 24 October 2017 04:















CL-F41. Markers:
—
896 13) 937.0
Back
Total,
Peak-1
Lprnenea dais cinasedl
Ee
1511 Show State

Proceed Append to File`

Код, использованный для создания этого вывода, был:

try:
    from PIL import Image
except ImportError:
    import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract.exe'

print(pytesseract.image_to_string(Image.open('C:/Users/vatsa/Desktop/Screenshot from 2020-06-15 21-41-06.png')))

Что касается изображения, я заинтересован в извлечении чисел, присутствующих в этих позициях на всех снимках экрана, где 146.47, 915.16, 354.5 и 18.89 присутствуют на этом рисунке и, вероятно, сохранят их в виде списка. Как я могу добиться такой функциональности с помощью Python?

Кроме того, при открытии рассматриваемого изображения с помощью Google Docs (ссылка здесь) показывает, какую огромную работу делает Google по извлечению текста. Может ли автоматизированная программа выполнить работу по использованию Документов Google для этого преобразования, а затем очистить нужные значения данных, как описано ранее? Любой подход к решению проблемы будет приемлемым, и любая попытка найти решение будет высоко оценена.

[править]: вопрос, предложенный в разделе комментариев, был действительно проницательным, но не доказал свою эффективность, поскольку данный код не смог найти контуры чисел на изображении, и поэтому модель не могла быть обучен.

...