Question

У меня есть 1 ТБ изображений, хранящихся в GCS (данные разбиты на 3 класса). Я хочу обучить пользовательскую модель Tensor Flow этим данным в Kubeflow. В настоящее время у меня есть конвейерные компоненты для обучения и сохранения модели, но я не знаю, как правильно подать эти данные в классификатор.

Мне кажется, что скачивание этих данных из GCS (gsutil cp / что-то другое) каждый раз, когда я запускаю (возможно, с ошибкой), конвейер не является подходящим способом сделать это.

Как использовать большие объемы данных в конвейерах Kubeflow, не загружая их каждый раз? Как выразить доступ к этим данным с помощью Kubeflow DSL?

Amy U. · Answer 1 · 12 апреля 2019

Кроме того, если ваши данные равны в GCS, то TensorFlow поддерживает возможность доступа к данным в GCS (и записи в них). tf.data api позволяет настроить эффективный конвейер ввода данных.

Akash Sharma · Answer 2 · 12 апреля 2019

Можно ли смонтировать том на хост-компьютере?

Если да, подключите том на хосте, а затем подключите этот каталог к контейнерам как hostPath, чтобы образы уже были подключены к узлу, и при каждом запуске нового контейнера он может подключать том к контейнеру и запускать процесс, избегая передачи данных на каждом запуск контейнера.

Как использовать большие объемы данных в Kubeflow?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать большие объемы данных в Kubeflow?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы