Я то, что Корнелис ван Лит из Цифровой востоковед называет "кентавром" или ученым, который посвящает время разработке программных решений для задач гуманитарных исследований. Я столкнулся с проблемой, которую НЕ удалось решить с помощью поиска в стеке и других сетевых ресурсах.
Я разработал решение FileMaker для управления 150 000 цифровых суррогатов оригинальных источников, аналогично тому, как пользователь Reddit с ограниченными данными предложил несколько лет go.
Я хочу расширить мое решение с Google Vision API. В частности, я хочу использовать Vision для выполнения OCR на этих цифровых суррогатах. Я видел Youtube видео , которое делает именно то, что я спрашиваю, но с Amazon API Textract. Я попробовал Textract на своих цифровых суррогатах и нашел неубедительные результаты. Мои суррогаты в испанском sh, и значительная их часть написана от руки. Google Vision API, в моем случае, дал лучшие результаты. Кроме того, у Vision есть клиентская библиотека Python, с которой я очень хорошо знаком.
Итак, моя проблема и вопрос касаются Python интеграции с Filemaker Pro Advanced (НЕ ХОСТИНГ НА СЕРВЕРЕ FILEMAKER)
Есть ли способ передать PDF из поле контейнера до Python? И после Python делает ли это свое дело - разделение PDF, обработка отдельных изображений, отправка указанных изображений в Vision, вставка результатов и их рекомбинация - отправлять строку вывода обратно в FileMaker в новом поле?
Триггер будет со стороны FileMaker, поэтому использование доступных python библиотек или превращение решения в источник ODB C не будет полезным. Есть некоторые плагины FileMaker, которые могут запускать скрипт Python, я думаю, что Python будет запускать подпроцесс из FileMaker, но нет четкого указания, как это сделать. Я аспирант, поэтому о плате за консультацию не может быть и речи. Есть ли кто-нибудь, кто может помочь?