У меня есть список вопросов, касающихся использования AWS, но я не уверен, что получу правильный ответ или использую наилучшую доступную практику.
До использования AWS у меня есть или выполняетсяв моем Macbook следующее: - Поддерживайте небольшую базу данных .odb (около 100 МБ), но ожидается, что она увеличится до нескольких ГБ в год.- У вас есть несколько R-скриптов, чтобы сделать поиск в сети и импортировать данные в базу данных.- Иметь еще несколько R-сценариев для извлечения данных из базы данных и проведения анализа.
Учитывая растущий объем данных и необходимость выполнять более сложную аналитику, мой Macbook всегда сильно загружен, и я решил переключиться на AWS длялучшая вычислительная мощность при необходимости.Я использую уровень бесплатного пользования AWS, и ниже это то, что я до сих пор успешно использовал с помощью AWS:
- Я создал экземпляр EC2 и мог извлекать файлы из моего хранилища S3.
- Я могу выполнить анализ, используя мои R-скрипты, и сохранить результат в моем контейнере S3.
И вот список моих вопросов:
Для поддержки базы данных размером ~ 1 ГБ, хорошо ли просто поместить ее в S3 и каждый раз загружать весь файл в R? Или я должен попробовать службу RDS?
Взимается ли плата за передачу данных между экземплярами EC2 и моим S3 bu (т. Е. Имеет ли значение, если я передаю и извлекаю данные 10 ГБ между экземпляром и S3 по сравнению с 1000 ГБ?) Я не уверен, где найти эту информацию.
За просмотр веб-страниц с использованием экземпляра EC2 взимается плата за подключение к Интернету? Или стоимость применяется только к типу экземпляра, который я выбираю для использования, независимо от того, выполняю ли яВычисления или очистка веб-страниц?
Я также прочитал несколько статей о AWS EBS, но меня очень смущает разница между S3, EBS или настройкой RDS.
Я ожидаю, что мои данныеобъем растет в геометрической прогрессии по мере того, как я пишу больше R-скриптов, чтобы отбирать различные общедоступные данные для анализа.С точки зрения вычислительной мощности, в настоящее время мне нужно больше, чем предлагает мой MacBook, главным образом для выполнения некоторой параллельной обработки и анализа.В будущем я также опробую некоторый алгоритм машинного обучения.
Любой совет будет полезен.