Это что-то вроде Redmon , которое вы ищете (используется в сочетании с выводом в файл и запуском приложения)?Если это так, вы можете использовать его или есть другие.Redmon немного устарел, и в зависимости от ОС у вас могут возникнуть проблемы.Если вы можете, добавьте больше деталей и подробностей к вашему вопросу, так как это немного сбивает с толку.
ОБНОВЛЕНИЕ (на основе комментариев): если источником является PDF или какой-либо другой документ (например, Word), в котором есть текстне только данные типа графика (сканирование / изображение), вы можете использовать драйвер Postscript (тип 1 может работать лучше), а затем извлечь текст после захвата файла печати.Если вы не собираетесь использовать файл печати для фактического вывода и просто нуждаетесь в данных, вы всегда можете попробовать драйвер Generic Text в Windows, поскольку он будет игнорировать GraphCIS и просто помещать текст в выходной файл.До тех пор, пока результат будет постоянным, а маленький Regex сможет вытащить то, что вам нужно.
Если данные графического характера, такие как отсканированное изображение, которое вы печатаете, вам нужно будет захватить задание на печать, превратить его в графическое изображение (так как это будет файл печати с PCL или Postscriptи т. д.), а затем запустите его через механизм распознавания текста, чтобы вытащить то, что вам нужно.