В кластере hadoop следует ли устанавливать куст на всех узлах? - PullRequest
13 голосов
/ 10 декабря 2011

Я новичок в Hadoop / Hive, и я только начал читать документы.Есть много блогов по установке Hadoop в режиме кластера.Кроме того, я знаю, что Hive работает поверх Hadoop.Мой вопрос: Hadoop установлен на всех узлах кластера.Стоит ли также устанавливать Hive на всех узлах кластера или только на главном узле?

Ответы [ 3 ]

26 голосов
/ 10 декабря 2011

Нет, это не то, что вы устанавливаете на рабочих узлах.Hive - это клиент Hadoop.Просто запустите Hive в соответствии с инструкциями, которые вы видите на сайте Hive .

0 голосов
/ 26 октября 2016

Hive в основном используется для обработки структурированных и полуструктурированных данных в Hadoop.Мы также можем выполнить анализ больших наборов данных, присутствующих в HDFS, а также в файловой системе Amazon S3, используя Hive.Для запроса данных куст также предоставляет язык запросов, известный как HiveQL, который похож на SQL.Используя Hive, можно легко запускать Ad-hoc запросы для анализа данных.Используя Hive, нам не нужно писать сложные задания Map-Reduce, нам просто нужно отправлять SQL-запросы.Hive преобразует эти запросы SQL в задания MapReduce.

Наконец, Hive SQL преобразуется в задания MapReduce, и нам не нужно отправлять задание MapReduce со всех узлов в кластере Hadoop, так же как мынеобходимо установить Hive во всех узлах кластера Hadoop

0 голосов
/ 13 марта 2015

Не нужно устанавливать куст в кластере, клиентскому компьютеру требуется куст для отправки заданий. Вот Руководство по установке улья Cloudera

...