Как создать компонент Kubeflow из задания PyTorch? - PullRequest
1 голос
/ 16 апреля 2020

Я недавно начал использовать Kubeflow. Моя цель - запустить PyTorch в Kubeflow. Я просмотрел документацию по созданию распределенного задания PyTorch здесь . Я также прочитал всю документацию о том, как создавать конвейеры / компоненты в Kubeflow.

Мой вопрос заключается в том, как теперь я могу взять задание PyTorch, которое является ресурсом Kubernetes, и запускать его как компонент. Конечная цель состоит в том, чтобы мой код PyTorch, который представляет собой распределенное обучение некоторой модели, выполнялся в рамках компонента / конвейера Kubeflow. Как задания с несколькими рабочими вписываются в структуру компонентов / конвейеров Kubeflow?

Документация содержит много информации о том, как запускать компоненты из кода python, контейнеров Docker и т. Д. c .. но ничего о том, как сделать это из работы PyTorchJob или Kubernetes. Мне это кажется очевидным вариантом использования, и я чувствую, что упускаю что-то очевидное, но я просмотрел всю документацию по Kubeflow, которую смог найти, и провел дополнительные поиски, чтобы узнать, как это сделать.

Буду признателен за любую помощь, спасибо!

...