Dataset<Row> ds = spark.read().option("multiLine", true).option("mode",...
Итак, я передаю это в командную строку: hadoop jar target/lab2-1.0.jar edu.sjsu.cs185C.HousesDriver...
У меня есть параметр времени выполнения со значением, подобным '2017-01-01', '2017-01-02' И я хочу...
Я написал программу преобразования карт, но редуктор не работает, ниже приведен код, который я...
Я пытаюсь извлечь данные из таблицы Hive и записать в локальные файлы: Один выходной файл на...
Запуск процесса hiveserver2 (v3.0.0 hive) на ec2 (не emr), процесс запускается и в течение первых 1...
Предположим, у меня есть tar.gz архив с 7 CSV-файлами в нем.Как манипулировать таким архивом tar.gz...
Я работаю на кластере HDInsight с использованием HDI версии 3.6.Из различных статей я понимаю, что...
в конце сценария bash У меня есть простой код для вывода списка файлов CSV в определенном каталоге:...
Я бы хотел ускорить процесс улья, но я не знаю, как это сделать.Данные имеют размер около 200 ГБ и...
Я пытаюсь запустить hadoop, запустив ./start-dfs.sh, но получаю некоторые синтаксические ошибки
У меня есть искровое задание, которое выполняет некоторый анализ данных, и между началом каждого...
У нас есть выходная пакетная обработка, которая работает, как указано ниже Hive SQL используется...
Я пытаюсь создать скрипт для проверки отсутствия какого-либо файла в пути hdfs.Идея состоит в том,...
Я хочу написать огромную таблицу из SQL в таблицу Kudu, я не могу записать ее в таблицу Kudu. Со...
Я использую следующий код для экспорта таблицы из куста в hdfs в формате csv / tsv. INSERT...
У меня есть файл .DAT с более чем 140 столбцами.Я хочу создать таблицу в HIVE и импортировать...
Кажется, нехватка ресурсов из-за других запущенных заданий в той же очереди. Есть ли способ обойти...
У меня есть широкая фиксированная ширина файла из источника. Мне нужно извлечь несколько столбцов...
Я пытаюсь запустить клиентский код HBase для создания таблицы в HBase, работающей на экземпляре AWS...
на самом деле я новичок в среде hadoop и у меня много трудностей.Кто-нибудь может помочь в...
Я пытаюсь использовать команду hdfs dfs - du -h для отображения размера файлов и папок. Команда,...
Я пытаюсь создать файл последовательности hadoop. Я успешно создаю файл последовательности в HDFS,...
Я добавил эту строку в свой код, чтобы переопределить системные классы своими собственными: conf
Мне нужна помощь. У меня есть такие данные: anum bnum 8661994 8661993 8661994 8661993 8661994...