У меня на работе есть устаревшая система управления документами, которая по разным причинам не поддерживается разработчиками. Меня попросили изучить возможность извлечения документов, содержащихся в этой системе, для последующего импорта в новую стороннюю систему.
Из отслеживания и мониторинга процесса я определил, что изображения документов (в основном файлы TIFF) хранятся в нескольких файлах объемом 1,5 ГБ. Похоже, что эти файлы считываются с определенного смещения, а затем записываются в файл tmp, который затем передается клиенту через веб-приложение, а затем удаляется.
Мне кажется, я ищу предложения о том, как я могу проверить эти большие файлы, содержащие изображения tiff, и в конечном итоге извлечь и записать их в отдельные файлы.