В рамках моего дипломного проекта мне был предоставлен дамп MongoDB размером 240 ГБ, который находится на моем внешнем жестком диске. Мне придется использовать эти данные для запуска моих скриптов Python в течение короткого времени. Однако, поскольку мой набор данных огромен, и я не могу импортировать mongo на свой локальный сервер mongodb (так как у меня недостаточно внутренней памяти), мой профессор дал мне купон на облачную платформу Google на 100 долларов, чтобы я мог использовать ресурсы облачных вычислений Google.
До сих пор я исследовал, что могу сделать это следующим образом:
Создать вычислительный движок в GCP и установить mongodb на удаленном движке. Перенесите дамп MongoDB в удаленный экземпляр и запустите сценарии, чтобы получить выходные данные.
Этот метод работает хорошо, но я ищу способ создания удаленного сервера базы данных в GCP, чтобы я мог запускать свои сценариилокально, что-то вроде одного из следующих.
Создание удаленного сервера mongodb на GCP, чтобы я мог установить удаленное соединение mongo для локального запуска своих сценариев.
Передача дампа mongodbв хранилище данных Google, так что я могу использовать API хранилища данных для удаленного подключения и запуска своих сценариев локально.
Я подумал об использовании атласа MongoDB, но из-за размера данных,Мне будет выставлен огромный счет, и я не смогу использовать свой купон GCP.
Будем благодарны за любую помощь или предложения о том, как можно реализовать любой из двух методов.