Распознать изображения в Python - PullRequest
6 голосов
/ 13 февраля 2012

Я немного новичок в распознавании OCR и Python.

То, чего я пытаюсь добиться - это запустить Tesseract из скрипта Python, чтобы «распознавать» некоторые конкретные цифры в .tif.

Я думал, что смогу пройти обучение для Тессеракта, но я не нашел подобной темы в Google и здесь, на SO.

По сути, у меня есть какой-то файл .tif, содержащий несколько изображений (например, «стрелка», «цветок» и другие значки), и я хочу, чтобы скрипт выводил имя этой иконки. Если он находит стрелку, выведите «стрелку».

Возможно ли это?

1 Ответ

1 голос
/ 17 февраля 2012

Это ни в коем случае не полный ответ, но если в формате tif есть несколько изображений и если вы заранее знаете размер, вы можете стандартизировать образцы изображений до их классификации. Вы бы разрезали изображение на все возможные прямоугольники в TIF.

Таким образом, когда вы создаете классификатор (я не упоминаю методы здесь), конечный результат будет обобщать классификацию всех меньших прямоугольников.

Так, если дано tif, изображения 'стрелки' или 'цветка' имеют размер 16 на 16 пикселей, например, вы можете использовать Python PIL для создания образцов.

from PIL import Image

image_samples = []

im = Image.open("input.tif")
sample_dimensions = (16,16)

for box in get_all_corner_combinations(im, sample_dimensions):

    image_samples.append(im.crop(box))


classifier = YourClassifier()

classifications = []

for sample in image_samples:
    classifications.append (classifier (sample))

label = fuse_classifications (classifications)

Опять же, я не говорил об обучающем этапе написания YourClassifier. Но, надеюсь, это поможет разобраться с частью проблемы.

Существует много исследований по предмету обучения для классификации изображений, а также по устранению шумов на изображениях перед их классификацией.

Подумайте о просмотре этой замечательной коллекции существующих библиотек машинного обучения Python.

http://scipy -lectures.github.com / продвинутый / scikit учиться / index.html

Есть много техник, которые также относятся к изображениям.

...