Я использую tika для извлечения текста из PDF в python. Но он загружает .jar при каждом запуске. что занимает много времени.
tika
python
[MainThread ] [INFO ] Retrieving http://search.maven.org/remotecontent?filepath=org/apache/tika/tika-server/1.19/tika-server-1.19.jar to /tmp/tika-server.jar.
Это происходит каждый раз, когда я запускаю код. Есть ли способ сделать это вручную один раз и остановить tika делать это каждый раз?