Как запустить рабочие процессы Snakemake в кластерах Kubernetes или OpenShift? - PullRequest
0 голосов
/ 01 ноября 2019

Мы пытаемся запустить рабочие процессы Snakemake в Kubernetes на базовой инфраструктуре. Мы используем OpenShift OKD в файловой системе MapR более точно.

Мы следовали команде официальная документация :

snakemake --kubernetes --use-conda --default-remote-provider $REMOTE --default-remote-prefix $PREFIX

Но справка командной строки для --default-remote-providerи --default-remote-prefix неясно, как мы должны выполнять конвейеры Snakemake на локальном кластере Kubernetes или OpenShift:

--default-remote-provider: choose from 'S3', 'GS', 'FTP', 'SFTP', 'S3Mocked', 'gfal', 'gridftp', 'iRODS'

Кроме того, официальная документация гласит:

В этомВ этом режиме Snakemake будет предполагать, что все входные и выходные файлы будут храниться в заданном удаленном месте, настроенном путем установки $ REMOTE для вашего выбранного поставщика (например, GS для облачного хранилища Google или S3 для Amazon S3) и $ PREFIX для имени корзины илиподпапка в этом удаленном хранилище.

Итак, мне было интересно:

  • Как следует продолжить развертывание рабочего процесса Snakemake для установки в помещении OpenShift / Kubernetes?

  • Есть ли пример (например, github repo или блог) запуска Snakemake на кластерах помещений?

  • В частности, я не уверен, какойНужно выбрать удаленного провайдера и как предоставить префикс (можно ли связать его с заявкой на постоянный том Kubernetes?)

Большое спасибо за помощь!

...