разница между Amazon EC2 и EMR - PullRequest
0 голосов
/ 23 марта 2020

Я новичок в облачных сервисах Amazon. Изучая это, я столкнулся с терминами EC2 and EMR

. До сих пор я понял, что EC2 подобен обычной облачной машине, а EMR - это группа облачных машин EC2. Во-вторых, EMR предпочтительнее для архитектуры распределенных вычислений, например, Had oop или Spark.

1) Почему EMR предпочтительнее для distributed computing? Почему нельзя использовать несколько экземпляров EC2 (НЕ EMR)?

2) Может ли кто-нибудь поделиться большим различием между EMR и EC2, чтобы понять больше?

Спасибо

1 Ответ

2 голосов
/ 23 марта 2020

EC2 (Elasti c Compute Cloud) - это универсальные c Linux или Windows серверы, которые можно использовать для запуска чего угодно. Однако, если вам нужно что-то вроде распределенного кластера Had oop или кластера RDBMS, вам придется потратить много времени на его настройку.

EMR (Elasti c Map Reduce), как Название подразумевает, что оно специально настроено для обработки заданий уменьшения карты с помощью таких инструментов, как Had oop и Spark. Он предварительно сконфигурирован и готов начать обработку вашей карты, уменьшая количество заданий.

EMR - это просто сервис, построенный на основе EC2, чтобы упростить выполнение таких задач, как распределенная карта, и сократить количество заданий. Это избавляет вас от необходимости настраивать распределенный вычислительный кластер самостоятельно. Подобно тому, как RDS является службой управляемой базы данных, построенной на основе EC2, которая управляет такими вещами, как резервное копирование, реплики чтения и аварийное восстановление.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...