Пожалуйста, найдите здесь ссылку на рассматриваемое изображение. 1 Я пробовал использовать PyTesseract для достижения поставленной цели. Хотя он хорошо работает для извлечения слов, он не выбирает числа с какой-либо степенью приемлемой точности. Фактически, он вообще даже не выбирает нужные мне числа. Я намереваюсь разработать программу, которая собирает числа из четырех конкретных мест на изображении и сохраняет их в переменной структурированных данных (list / dictionary / et c.), И поскольку мне нужно сделать это для хороших 2500-с лишним снимков экрана с помощью этой программы я не могу вручную выбрать нужные мне числа, даже если она начинает их правильно читать. Следующий результат был возвращен при использовании PyTesseract (для изображения, о котором говорилось выше).
`Activities Boyer STA
Candle Version 4.1-9 IUAC, N.Delhi - BUILD (Tuesday 24 October 2017 04:
CL-F41. Markers:
—
896 13) 937.0
Back
Total,
Peak-1
Lprnenea dais cinasedl
Ee
1511 Show State
Proceed Append to File`
Код, использованный для создания этого вывода, был:
try:
from PIL import Image
except ImportError:
import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files/Tesseract-OCR/tesseract.exe'
print(pytesseract.image_to_string(Image.open('C:/Users/vatsa/Desktop/Screenshot from 2020-06-15 21-41-06.png')))
Что касается изображения, я заинтересован в извлечении чисел, присутствующих в этих позициях на всех снимках экрана, где 146.47, 915.16, 354.5 и 18.89 присутствуют на этом рисунке и, вероятно, сохранят их в виде списка. Как я могу добиться такой функциональности с помощью Python?
Кроме того, при открытии рассматриваемого изображения с помощью Google Docs (ссылка здесь) показывает, какую огромную работу делает Google по извлечению текста. Может ли автоматизированная программа выполнить работу по использованию Документов Google для этого преобразования, а затем очистить нужные значения данных, как описано ранее? Любой подход к решению проблемы будет приемлемым, и любая попытка найти решение будет высоко оценена.
[править]: вопрос, предложенный в разделе комментариев, был действительно проницательным, но не доказал свою эффективность, поскольку данный код не смог найти контуры чисел на изображении, и поэтому модель не могла быть обучен.