Мой пример использования следующий:
У меня есть скрипт python, который:
1. reads a file from S3
2. processes the file and outputs a new file
3. saves the output file to S3 (or maybe a database)
Скрипт python имеет некоторые зависимости, которые управляются через virtualenv.
Каков рекомендуемый / самый простой способ параллельного запуска этих сценариев в AWS?
Я вижу следующие параметры:
- Пакет AWS: выглядит действительно сложно - мне нужно создать свой собственныйКонтейнер Docker, настраивающий 3 разных пользователей, отладить нелегко.
- AWS Lambda: немного проще в настройке, но мне все еще нужно свернуть свой сценарий в функцию Lambda.Отладка не кажется слишком простой.
- Раздражение при ручном раскручивании экземпляров EC2 - с точки зрения пользователя, это идеально - все, что мне нужно сделать, это просто создать файл jobs.sbatch, который загружает virtualenv и запускаетсценарий.Основным недостатком является то, что мне нужно установить и настроить slurm.
Каков рекомендуемый способ обработки этого рабочего процесса?