Разбор / Соскреб информации с изображения - PullRequest
0 голосов
/ 08 ноября 2011

Я ищу библиотеку, которая помогла бы соскоблить информацию с картинки ниже. Мне нужно текущее значение, чтобы оно распознало значения слева и затем оценило значение нижней строки.

Есть идеи, есть ли библиотека, которая могла бы сделать что-то подобное? Язык не очень важен, но я думаю, что Python будет предпочтительнее.

Спасибо

Image to Scrape

1 Ответ

0 голосов
/ 08 ноября 2011

Я не знаю ни одного "готового" решения для этого, и я сомневаюсь, что оно существует.Если все, что у вас есть, это изображение, то вам нужно будет немного обработать изображение.Простой метод бинаризации (такой как бинаризация Оцу) облегчит обработку:

Binarized image

Бинаризация делает это проще, потому что теперь пиксели либо «включены», либо «выключены».

Места для линий можно найти, выполнив поиск некоторого количества пикселей, которые все расположены горизонтально (5 включений подряд при итерации по оси x?).

Тогда возможноеРешением было бы передать изображение в механизм OCR для получения чисел (tesseractOCR - это механизм OCR с открытым исходным кодом, размещенный в Google (C ++): tesseractOCR ).Вам все равно придется выяснить, где находятся цифры на изображении, перебирая его.

Затем вам нужно будет найти расположение линий относительно клавиш слева и немного поработать.и вы можете получить свой ответ.

OpenCV - это мощная библиотека компьютерного зрения, которая имеет такие вещи, как бинаризация.Это также библиотека C ++.

Надеюсь, это поможет.

...