У меня есть требование записывать журналы приложений Yarn из EMR в другой источник, отличный от S3....
Я использовал улей нормально, когда внезапно я больше не мог запускать «CREATE TABLE ...» или...
Я установил Java, Hadoop, Hbase, Hive, Spark и Kylin.hadoop-3.0.3 hbase-1.2.6 apache-hive-2.3.3-bin...
Я пытаюсь запустить сценарии Pig на Zeppelin: %sh sudo -u niyya hadoop fs -put...
Я хочу отправить запрос во время работы карты редукции программы из картографа на другой узел,...
У меня есть данные, которые выглядят следующим образом:...
Я пытаюсь объединить результаты, полученные от двух заданий MapReduce.Первая работа возвращает 5...
Этот скрипт работает нормально data1 = LOAD '/user/maria_dev/ml-100k/test/u3.data' AS...
Я получаю ошибку ниже при запуске искрового задания. Это похоже на проблему несовместимости в...
Должна ли кучная память (xmx на ps) всегда быть больше, чем память исполнителя / драйвера для...
Я пытаюсь установить apache-spot и Cloudera на AWS, следуя этим инструкциям: http://blog.cloudera
Я только начал использовать потоковые наборы, и я пытаюсь загрузить текстовый файл с локального на...
Допустим, у меня есть файл размером менее 1024 КБ.Если этот файл хранится с использованием политики...
У меня уже есть много времени, требующее сокращения карты, работающее в моем кластере.Когда я...
Проработанный сценарий -> каталог HDFS, который «заполняется» новыми данными журнала о нескольких...
Мне снова нужна помощь Есть ли эквивалент в функции Contains в SAS Hadoop (явное прохождение SQL)?...
У меня возникает следующая ошибка при доступе к быстрому запуску Hue в Cloudera.Я проверил...
Я использую hive. Когда я пишу динамические разделы с помощью запроса INSERT и включаю параметр...
Я работаю над простой программой сокращения карт, использующей набор данных Kaggle https://www
Паркет создается с нуля с учетом сложных вложенных структур данных и использует алгоритм...
Имеется сжатый файл, написанный на платформе hadoop, в одном из следующих форматов: Avro Parquet...
Я хочу присоединиться к 3 tables, используя spark rdd.Я достиг своей цели, используя spark sql, но...
В настоящее время clickhouse хранит данные по / var / lib / clickhouse пути, и я прочитал, что не...
hiveserver2 запущен и работает, и я могу проверить это с http://localhost:10002/hiveserver2.jsp....
В настоящее время у меня есть задание ETL, которое читает несколько таблиц, выполняет определенные...