У меня интенсивный вычислительный проект с высокой степенью параллелизации: в основном, у меня есть функция, которую мне нужно запускать для каждого наблюдения в большой таблице (Postgresql).Сама функция является хранимой процедурой Python.
Amazon EC2 отлично подходит для проекта.
Мой вопрос таков: должен ли я создать собственное изображение (AMI), которое уже содержит базу данных?Казалось бы, это дает преимущество минимизации передачи данных и упрощения распараллеливания: каждое изображение может получить определенный блок индексов для вычисления, например, изображение 1 получает 1: 100, изображение 2 101: 200 и т. Д. Разделение данных иэкземпляры (которые предлагают большинство практических руководств) не имеют смысла для моего приложения, но я очень новичок в этом, поэтому я не уверен, что моя интуиция верна.