Я хочу запустить длительный процесс анализа Python на нескольких экземплярах Amazon EC2.Код уже выполняется с использованием модуля python multiprocessing
и может использовать все ядра на одном компьютере.
Анализ полностью разбит на части, и каждому экземпляру не нужно взаимодействовать с каким-либо другим.Вся работа «на основе файлов», и каждый процесс работает с каждым файлом индивидуально ... поэтому я планировал просто смонтировать один и тот же том S3 на все узлы.
Мне было интересно, знает ли кто-нибудьлюбых учебных пособий (или предложений) по настройке многопроцессорной среды, чтобы я мог запускать ее одновременно на произвольном количестве экземпляров вычислений.