Я выполняю проект Data Science с Python и Sklearn и на этом этапе я хотел бы создать облачная визуализация с использованием данных и модели, которую я обучил для заинтересованных сторон. Я уже закончил код da sh и отлично работает локально:
Размер моих данных: около 1 ГБ маринованного файла
Размер моей модели: около 4 ГБ модели маринованного случайного леса
Мне нужно было бы использовать pandas для чтения данных и модели, чтобы делать прогнозы, затем da sh для визуализации. Когда я развернул его локально, я проверил со своего монитора активности, что он потребляет до 18 ГБ оперативной памяти.
Теперь вопрос заключается в том, как легко развернуть его в облачных службах. Я заметил, что Google App Engine предоставляет до 2 ГБ ОЗУ, мне кажется, что облачным приложениям обычно не нужно так много памяти. У кого-нибудь есть идеи или опыт, как управлять развертыванием облачных приложений с огромным размером данных / модели?