Как интегрировать Presto кластер в кластер Hadoop? - PullRequest
1 голос
/ 18 апреля 2019

У нас есть кластер Hadoop на основе ambari Поскольку у экономичного сервера низкая производительность, мы решили заменить его на presto Наш нынешний кластер Hadoop имеет следующие машины 960 компьютеров с узлами данных (на базе ОС Redhat 7)

Несколько слов о Presto (или PrestoDB) - это распределенный механизм SQL-запросов с открытым исходным кодом, разработанный с нуля для быстрых аналитических запросов к данным любого размера. Он поддерживает оба нереляционных источника, такие как распределенная файловая система Hadoop (HDFS),

Мы установили новый сервер Presto следующим образом Сначала мы установили ОС (redhat 7), всего 13 машин 1 машина для координатора Presto И 12 машин для рабочих

После установки ОС Мы успешно установили Presto (Presto Координатор + Presto работников)

Теперь мы застряли на том, как сделать интеграцию между Presto кластером и кластером Hadoop

Я приведу короткий пример с разъемом улья (hive.properties)

у нас есть следующая переменная hive.config.resources = / и т.д. / Hadoop / CONF / ядро-site.xml, / и т.д. / Hadoop / CONF / HDFS-site.xml * * +1013

, поскольку этот файл находится на компьютерах узлов данных и, разумеется, не на рабочих машинах Presto, я предполагаю, что нам нужно скопировать эти файлы с одного из компьютеров узлов данных на рабочие машины Presto

я здесь?

1 Ответ

0 голосов
/ 20 апреля 2019

Обычно вам не нужно настраивать hive.config.resources, чтобы Presto могла общаться с вашим кластером HDFS. Попробуйте использовать Presto без этой конфигурации. Настраивайте его, только если у вас есть особые требования, такие как Hadoop KMS.

Чтобы настроить его, скопируйте соответствующие файлы конфигурации Hadoop на свои машины Presto (координатор и рабочие), затем установите hive.config.resources, чтобы указать на эти файлы.

Подробнее см. В документации к Hive .

...