Итак, у меня есть папка, которую я заархивировал и отправил в hdfs, мне нужно разархивировать эту...
Запуск docker-deploy-hdp265.sh получить следующий вывод консоли: + registry=hortonworks +...
Я хочу написать собственный обработчик хранилища, но тот, который может читать базовые данные,...
Я знаю, что файлы начинаются с "_" и "."скрытые файлы.И hiddenFileFilter будет всегда применяться
Я запускаю приложение Flink через YARN на Amazon EMR с одним ведущим и одним ведомым. Я пытаюсь...
Я пишу пользовательский Hive SerDe, который может читать данные, хранящиеся как ORC. Базовая...
Итак, я пытаюсь запустить задание импорта sqoop, где я сохраняю файлы паркета на основе моего ключа...
Я пытаюсь настроить кластер hadoop3 в локальной компьютерной сети в небольшом масштабе для запуска...
Привет: у меня есть ситуация, когда мне нужно найти максимальное значение для 3 вычисляемых полей и...
Мы используем apache spark в автономном режиме для mllib. У нас также есть DFS (распределенная...
У меня есть ряд вопросов, связанных с sqoop: 1) В чем разница между sqoop --incremental...
Сначала я запускаю spark-shell в Windows, и я читаю файл с локального val res0 = sc
У меня есть внешняя таблица ORC с большим количеством маленьких файлов, которые ежедневно поступают...
Я прочитал данные из таблицы Hive, отсортированные как файл Parquet, в DF. После применения...
У меня есть следующий код, в который я вставляю данные в таблицу txnaggr_rt_fact, в которой есть 2...
У меня есть кластер Apache Hadoop. Один из узлов столкнулся с перекошенным распределением данных....
У меня есть ситуация, когда мне нужно найти максимальное значение для 3 вычисляемых полей и...
Я хочу аутентификацию Kerberos с помощью SPNEGO из Chrome на ПК с Windows в Hadoop (kerberized). В...
Я пытаюсь получить доступ к ресурсам GCloud, в частности к пользовательскому интерфейсу Hadoop...
У меня есть пример данных, как показано ниже: UserId,ProductId,Category,Action 1,111,Electronics...
как всем известно, сердцебиение - это сигнал, отправляемый периодически для указания нормальной...
У меня есть данные таблицы, как показано ниже, и я хочу объединить данные с агрегацией. ColumnA...
В нашем приложении у нас есть данные из 3 разных стран, и мы сохраняем данные в HBase. В каждой...
Я хочу копировать файлы, не касаясь кодировки, на удаленный сервер. Я нашел одно решение,...
Я использую Sqoop для импорта данных из оракула в HDFS. Когда задание запускается, оно застревает...