AWS EBS, S3 и RDS - PullRequest
       36

AWS EBS, S3 и RDS

0 голосов
/ 01 июня 2018

У меня есть список вопросов, касающихся использования AWS, но я не уверен, что получу правильный ответ или использую наилучшую доступную практику.

До использования AWS у меня есть или выполняетсяв моем Macbook следующее: - Поддерживайте небольшую базу данных .odb (около 100 МБ), но ожидается, что она увеличится до нескольких ГБ в год.- У вас есть несколько R-скриптов, чтобы сделать поиск в сети и импортировать данные в базу данных.- Иметь еще несколько R-сценариев для извлечения данных из базы данных и проведения анализа.

Учитывая растущий объем данных и необходимость выполнять более сложную аналитику, мой Macbook всегда сильно загружен, и я решил переключиться на AWS длялучшая вычислительная мощность при необходимости.Я использую уровень бесплатного пользования AWS, и ниже это то, что я до сих пор успешно использовал с помощью AWS:

  1. Я создал экземпляр EC2 и мог извлекать файлы из моего хранилища S3.
  2. Я могу выполнить анализ, используя мои R-скрипты, и сохранить результат в моем контейнере S3.

И вот список моих вопросов:

  1. Для поддержки базы данных размером ~ 1 ГБ, хорошо ли просто поместить ее в S3 и каждый раз загружать весь файл в R? Или я должен попробовать службу RDS?

  2. Взимается ли плата за передачу данных между экземплярами EC2 и моим S3 bu (т. Е. Имеет ли значение, если я передаю и извлекаю данные 10 ГБ между экземпляром и S3 по сравнению с 1000 ГБ?) Я не уверен, где найти эту информацию.

  3. За просмотр веб-страниц с использованием экземпляра EC2 взимается плата за подключение к Интернету? Или стоимость применяется только к типу экземпляра, который я выбираю для использования, независимо от того, выполняю ли яВычисления или очистка веб-страниц?

  4. Я также прочитал несколько статей о AWS EBS, но меня очень смущает разница между S3, EBS или настройкой RDS.

Я ожидаю, что мои данныеобъем растет в геометрической прогрессии по мере того, как я пишу больше R-скриптов, чтобы отбирать различные общедоступные данные для анализа.С точки зрения вычислительной мощности, в настоящее время мне нужно больше, чем предлагает мой MacBook, главным образом для выполнения некоторой параллельной обработки и анализа.В будущем я также опробую некоторый алгоритм машинного обучения.

Любой совет будет полезен.

...