Как кешировать просторную модель в gitlab runner при построении docker образа - PullRequest
1 голос
/ 14 февраля 2020

Я использую docker и gitlab. Мой файл docker выглядит следующим образом:

FROM ubuntu:16.04
RUN apt-get update && apt-get install
RUN pip3 install wheel
RUN pip3 install spacy
RUN python3 -m spacy download en_core_web_md

Колесо и пакеты spacy кэшируются в средстве запуска GitLab при сборке контейнера docker, но не в модели spacy.

Есть ли способ кэширования модели en_core_web_md в средстве запуска GitLab, чтобы модель можно было установить, не загружая ее снова.

1 Ответ

0 голосов
/ 17 февраля 2020

Нашел решение. Вместо установки модели с помощью следующей команды:

RUN python3 -m spacy download en_core_web_md

Сначала необходимо загрузить модель

RUN pip3 download https://github.com/explosion/spacy-models/releases/download/en_core_web_md-2.2.0/en_core_web_md-2.2.0.tar.gz

, а затем установить ее.

RUN pip3 install /en_core_web_md-2.1.0.tar.gz

Когда Вы повторно запускаете конвейер, модель не будет загружаться снова.

...