Мы пытаемся запустить рабочие процессы Snakemake в Kubernetes на базовой инфраструктуре. Мы используем OpenShift OKD в файловой системе MapR более точно.
Мы следовали команде официальная документация :
snakemake --kubernetes --use-conda --default-remote-provider $REMOTE --default-remote-prefix $PREFIX
Но справка командной строки для --default-remote-provider
и --default-remote-prefix
неясно, как мы должны выполнять конвейеры Snakemake на локальном кластере Kubernetes или OpenShift:
--default-remote-provider: choose from 'S3', 'GS', 'FTP', 'SFTP', 'S3Mocked', 'gfal', 'gridftp', 'iRODS'
Кроме того, официальная документация гласит:
В этомВ этом режиме Snakemake будет предполагать, что все входные и выходные файлы будут храниться в заданном удаленном месте, настроенном путем установки $ REMOTE для вашего выбранного поставщика (например, GS для облачного хранилища Google или S3 для Amazon S3) и $ PREFIX для имени корзины илиподпапка в этом удаленном хранилище.
Итак, мне было интересно:
Как следует продолжить развертывание рабочего процесса Snakemake для установки в помещении OpenShift / Kubernetes?
Есть ли пример (например, github repo или блог) запуска Snakemake на кластерах помещений?
В частности, я не уверен, какойНужно выбрать удаленного провайдера и как предоставить префикс (можно ли связать его с заявкой на постоянный том Kubernetes?)
Большое спасибо за помощь!