Как запустить приложение Apache Crunch без Hadoop? - PullRequest
0 голосов
/ 23 мая 2018

Я слышал, что Apache Crunch - это фасад, и он может запускать приложения без Hadoop.Это правда?

Если да, то как это сделать?

В Apache Crunch Начало работы самый первый пример включает команду hadoop:

$ hadoop jar target/crunch-demo-1.0-SNAPSHOT-job.jar <in> <out>

Isможно опустить hadoop?

1 Ответ

0 голосов
/ 24 мая 2018

Возможно, вы неправильно поняли, что вам не нужен кластер Hadoop .Hive, Pig, Spark можно запускать локально или в файловых системах, отличных от HDFS.

Насколько я знаю о библиотеке, вам, тем не менее, нужен Hadoop API (именно это hadoop jar будет загружать для вас).

Другими словами, вы можете установить для входных и выходных каталогов локальный путь file://, чтобы обойти необходимость в HDFS.

Вы можете export CLASSPATH самостоятельно включить библиотеки Hadoop и запустить java jar для запуска JAR

...