Импала - это требует hdfs и namenodes? - PullRequest
0 голосов
/ 06 июля 2018

Может ли Apache Impala установить / запустить на EC2 (а не на EMR) чтение данных из S3? Или для работы требуются Hadoop Namenodes и HDFS? В документации не очень ясно о зависимостях установки.

1 Ответ

0 голосов
/ 11 июля 2018

Да, Impala может работать без hdfs. Единственный компонент, который требуется от экосистемы hadoop, это hive-metastore, который он использует для хранения метаданных.

Что касается доступности S3, вы можете обратиться к https://www.cloudera.com/documentation/enterprise/5-7-x/topics/impala_s3.html

...