Как отмечается в комментарии к вашему вопросу, звучит так, как будто вы ищете программное обеспечение для оптического распознавания символов.Вы могли бы взглянуть на использование Tesseract OCR - для него требуется файл TIFF для ввода и вывода простого текста, но вы можете легко вызвать его из сценария, который преобразует ввод из JPEG в TIFF и вывод из простого текстак тому, что вы хотите.Другой вариант для рассмотрения будет GOCR .