Я новичок в Spark & Scala и получил исключение после вызова saveAsTextFile ().Надеюсь, что кто-то...
У меня есть следующий CSV-файл, расположенный в path/to/file в моем магазине hdfs. 1842,10/1/2017...
Я недавно начал изучать Oozie, и для реализации логики приложения необходимо получить некоторую...
Я ищу лучший способ читать сообщения (много сообщений, около 100B каждый день) из Кафки, после...
Я создал таблицу кустов JSON, таблица успешно создана, но когда я запускаю desc table , ot select *...
Я новичок в HQL.Я пытаюсь удалить дубликаты элементов из 2 строк в HIVE. Текстовый файл содержит...
Я использую Java-клиент Oozie для запуска действия оболочки из моей Java-программы. Я хочу...
Везде говорится, что Spark и Flink должны заменить Hadoop MapReduce, потому что они лучше работают...
Если я перечислю все базы данных в Hive, я получу следующий результат (у меня есть 2 таблицы по...
Я получаю fileNotFoundException в указанной строке ниже. Ранее в Hadoop 1 это было функционально....
Я мог бы найти много ответов, связанных с этой темой, но не смог найти что-то связанное со...
Хотелось бы узнать, есть ли способ связать задания в Spark, поэтому выходной RDD (или другой...
Это не вопрос, связанный с программированием, прошу вас об этом. В настоящее время я настроил два...
Я объясню, что мне нужно сделать в Hive, на примере.Я получаю две строки: Первая строка с таким...
В Hive, есть ли какие-то преимущества в производительности при использовании DATE по сравнению с...
Я пытаюсь вставить вычисляемый раздел.Значение раздела должно быть вычислено из ключевого столбца
Я пытаюсь настроить и запустить кластер Spark, работающий поверх YARN и использующий HDFS. Сначала...
Я очень новичок в Hadoop и недавно настроил Hadoop внутри Virtual Box с Ubuntu, здесь Name Node и...
Попытка написать простую программу с spqrk. Я должен сгруппировать свои данные по одному атрибуту...
У меня есть набор данных со многими дублирующимися идентификаторами.Я просто хочу сделать...
Почему в hadoop получается пустой текстовый файл при чтении из HDFS. я использую метод itreative в...
col-1 имеет dep_id (varchar) - 112 col-2 имеет массив struct [ { "emp_id": 8291828,...
Я пытаюсь использовать hbase-testing-util (1.2.0) в моем проекте, но я получаю следующую ошибку: An...
В нашем приложении мы хотим, чтобы одновременно работал только один рабочий процесс oozie.Мы...
Предположим, нам нужно построить фильтр Блума с 10 ^ 12 сегментами на одной машине с 32 ГБ ОЗУ и...