В своем анализе данных я часто использую xlsx или csv-файл из удаленного местоположения (URL). Я хочу, чтобы мой код был воспроизводимым и понятным, поэтому лучше всего было бы загрузить файл в моем коде Python таким образом, чтобы URL-адрес содержался в моем скрипте, однако при запуске моего скрипта он будет загружать файл каждый раз, что занимает слишком много времени. Итак, мой вопрос: есть ли библиотека Python, которая автоматически загружает и кэширует файлы, чтобы я мог использовать URL-адреса в своем коде, например,
from remotecaching import r_url
f = open(r_url("https://domain.tld/resource.csv"))
В этом примере r_url загружает файл (если он не находится в локальном кэше) и возвращает путь к файлу в кэше.
Snakemake имеет аналогичную систему (https://snakemake.readthedocs.io/en/stable/snakefiles/remote_files.html), которая, однако, непригодна для использования вне экосистемы змеиного мейкера.