Я собираюсь убедить свою компанию перейти на Acrobat Pro, чтобы я мог автоматизировать обработку отсканированных документов. Прежде чем поднять это, я хочу убедиться, что то, что я хочу сделать, возможно. Мне не нужно, чтобы кто-нибудь давал мне код, я просто хочу знать, возможно ли это.
Документы, с которыми я работаю, имеют альбомный формат, 2-5 страниц и имеют имя файла и номера страниц. в нижнем колонтитуле. Я хочу отсканировать большой стек из них и заставить скрипт выполнить следующие действия:
Использовать OCR для получения имени файла и номеров страниц для каждой страницы. Я хотел бы ограничить OCR только просмотром нижнего колонтитула для экономии времени и оперативной памяти.
Используя имена файлов, я хочу, чтобы он обнаруживал, когда один документ заканчивается, а следующий начинается так, их можно разбить на отдельные файлы.
Перед сохранением файлов разделения убедитесь, что количество страниц в файле соответствует общему количеству страниц в нижнем колонтитуле. (Я работаю на фабрике, и документы могут залипать, поэтому мой сканер часто тянет сразу две страницы)
Вместо сохранения файлов, где общее количество страниц не совпадает, скомпилируйте список ошибок, чтобы я знал, какие документы необходимо повторно сканировать.
Наконец, сохраните все правильные документы с именами файлов из нижнего колонтитула в папку на рабочем столе.
Это может сэкономить мне часы в неделю, поэтому я надеюсь, что это все возможно. Спасибо