Оптимальный рабочий процесс для обработки данных для хранения файлов Jupyter в GitHub, но запуска и редактирования в Docker - PullRequest
0 голосов
/ 05 марта 2020

Я пишу блокнот для анализа моделей, который будет автоматически запускаться после обучения модели для хранения различных графиков и метрик. Модель обучается и размещается с использованием контейнера Docker, поэтому я запускаю ноутбук в локальном экземпляре контейнера Docker и перенаправляю его в мой браузер. Было бы трудно воспроизвести настройку файловой системы Docker вне контейнера Docker, поэтому запуск ноутбука Jupyter в любом месте за пределами контейнера Docker выглядит сложным.

Однако это означает, что я редактирую ноутбук Jupyter. в контейнере Docker вместо файла записной книжки с отслеживанием git на моем локальном компьютере. Если я отредактирую Docker Jupyter, но не смогу загрузить его на свой локальный компьютер и заменить устаревшую локальную версию, то при следующем вызове Docker с использованием локальных файлов все мои изменения будут перезаписаны. До сих пор этого не происходило, но в любом случае этот рабочий процесс кажется действительно неоптимальным. Кто-нибудь знает лучший способ сделать это развитие?

Если я делаю много вещей неправильно, чтобы оказаться в такой ситуации, я хотел бы услышать и об этом. Спасибо!

1 Ответ

0 голосов
/ 05 марта 2020

Так что я действительно делал вещи совершенно неправильно. Мои исходные файлы копировались в контейнер, когда я помещал sh изображение на AWS для использования. Однако для разработки я могу просто заменить исходные файлы фактическими файлами на моем локальном компьютере, подключив исходный каталог к ​​каталогу, в который исходные файлы были изначально скопированы. Таким образом, когда я редактирую блокнот Jupyter, я редактирую именно блокнот Jupyter, а не его копию.

...