Question

Я настраиваю кластер Hadoop для тестирования / PoC. Есть ли сегодня что-нибудь, что нельзя сделать со Spark в качестве движка обработки? Мне кажется, что Spark заменил MR, и все другие инструменты / абстракции, построенные вокруг Hadoop, также совместимы со Spark (Hive, Sqoop, Flume, HBase, Pig ...) - есть ли другие ограничения? Как я понимаю, Spark по крайней мере так же быстр, как MR, даже для пакетных заданий, и если вы хотите расширить свои варианты использования в будущем (потоковая передача), вам все равно придется адаптироваться к Spark.

Я спрашиваю, потому что на сегодняшний день большинство вводных и обучающих программ рассказывают вам о Hadoop и MapReduce.

Ben Watson · Answer 1 · 19 марта 2019

Проще говоря, нет, в наши дни нет причин использовать MapReduce. Spark быстрее, с ним легче работать, он постоянно совершенствуется, больше коннекторов, больше пользователей, больше оптимизаций ...

MapReduce используется в учебных пособиях, поскольку многие учебные пособия устарели, а также потому, что MapReduce демонстрирует основные методы обработки данных во всех распределенных системах. По моему мнению, любой, кто хочет работать с «большими данными», должен (хотя бы концептуально) понять MapReduce.

Выгода от использования MapReduce вместо Spark сегодня?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Выгода от использования MapReduce вместо Spark сегодня?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы