Мы пытаемся настроить IWA для SAS Data Loader для Hadoop (DLH). Серверы SAS работают в домене...
Я хочу выполнить дополнительное внутреннее соединение в запросе ниже, но у меня возникают...
Я занимаюсь копированием данных Hadoop на S3.И изучил другой вариант. Я узнал, что мы можем...
Я установил Hadoop на виртуальную машину Ubuntu. Я настроил HDFS, и я могу получить к нему доступ...
Мне нужно скопировать каталог из одного hdfs-пути в другой.Однако я сталкиваюсь с отсутствием...
У меня есть многоузловой кластер Hadoop с двумя узлами (один главный узел и один подчиненный узел)....
У меня ниже файловая система hdfs Code: /user/home/dte=2019_01_30/part_1...
Мы видим очень медленную фазу копирования: reduce > copy...
Я использую Hadoop MapReduce для вычисления минимального и максимального значения каждого года, но...
Я пытаюсь протестировать работу MapReduce в Java отдельно, которая является частью рабочего...
Существует Java и CLI-интерфейс для запроса Yarn RM о сопоставлениях между узлами и ярлыками (и...
Я пытаюсь извлечь часть года, месяца и дня из столбца метки времени в улье. В настоящее время вывод...
У нас большой кластер Hadoop и недавно установлен Elastic Search для оценки. Теперь мы хотим...
Я пытаюсь подключиться к экземпляру улья из приложения nodeJS. Я нашел пример использования jdbc, и...
Я получаю сообщение об ошибке ниже при запуске моей программы. Exception in thread "main"...
Я пытаюсь выбрать определенные поля в таблице улья и сохранить результат в текстовом файле....
Я пишу API в python2.7 (колба), я хочу получить данные (Database- Hbase), игнорируя регистр...
У меня есть таблица, которая выглядит следующим образом: usr_id query_ts 12345 2019/05/13 02:06...
Я использовал приведенный ниже код для извлечения необходимых мне строк в Spark SQL.Но теперь я...
Я хочу обработать ~ 500 ГБ данных , распределенных по 64 файлам JSON каждый, содержащий 5M записей
Я пытаюсь запустить команду parquet-tools , чтобы просмотреть только схему файла моего файла...
Я хотел бы разрешить двум экземплярам приложения использовать один кластер HDFS, но для каждого...
Я использую многопроцессорность в python 2.7, и мне нужно получить файл из HDFS с помощью команды...
У меня есть один узел Cloudera Cluster (CDH 5.16) на удаленном сервере Rhel 7.Я установил CDH с...
У нас есть необработанные данные, которые хранятся и обновляются в кластере hdfs, мы хотим ввести...