У меня есть приложение для обработки данных, которое мне нужно запускать каждые 2-3 часа, где мне нужно использовать 64 ядра в течение 6 минут смущающе параллельным образом. Каждое из ядер должно загружать 3 ГБ данных с диска в общей сложности 192 ГБ данных на диске.
Чтобы достичь этого экономически эффективным способом, я планирую развернуть 64-ядерный точечный экземпляр EC2 используя скрипт всякий раз, когда мне нужно запустить одно из этих заданий. Я также планирую иметь AMI на 200 ГБ с моими необходимыми данными. Затем, когда запускается экземпляр EC2, я могу запустить свои 64 задания, и каждый из них может загрузить туда свои 3 ГБ данных с SSD.
Будет ли это работать, и сколько времени потребуется, чтобы раскрутить место EC2 экземпляр с большим AMI? Если запуск экземпляра занимает несколько минут, это не очень хорошо, поскольку это всего лишь 6-минутные задания, которые я хочу быстро запустить. Есть ли лучший способ достичь моего рабочего процесса?