Я привык создавать MapReduce задания с использованием HBase таблиц в Hadoop+HBase. Я не работал...
Я работаю искровые процессы с использованием Python (Pyspark). Я создаю кластер amazon EMR для...
Я намеревался использовать псевдораспределенный режим Hadoop в IntelliJ.В настоящее время я могу...
Можно ли перемещать файлы в hadoop, используя FileSystem класс https://hadoop.apache.org/docs/r2.7
Я перенес файл из локальной файловой системы в HDFS с помощью команды put. Теперь я хочу проверить,...
Я включил Kerberos в своем кластере Hadoop через пользовательский интерфейс ambari, но когда я...
Я изменил разрешение каталога hdfs через hdfs dfs -chmod 777 /path/to/dir , но при записи в этот...
Ниже приведен фрагмент кода, который я пытаюсь запустить, и столкнулся с проблемой недопустимого...
Я пытаюсь подключиться к oracle db и перечислить имена таблиц с помощью sqoop следующим образом:...
Я знаю, что журналы аудита диспетчера ресурсов будут содержать сведения о заданиях пряжи (rm-audit
В чем разница между протоколом отправки приложений REST и традиционным протоколом отправки для...
Я хочу подтвердить адрес в моих данных, формат проверки Проспект Блок-Б 123. то есть символ числа с...
У меня есть набор данных с 100k строк с 17 столбцами. Я хотел бы знать, как группировать и...
CopyFromLocal будет загружать данные из локальной файловой системы. Do put будет загружать данные...
Я использую простой sql (выберите xx, xx ... из viewXXX, где xxxxx), используя hive0.13.1 на...
Попытка создать каталог для хранения данных твитера. При подаче этой команды говорится: mkdir:...
Я использую среду oozie. После успешного завершения работы я не могу найти выход System.out.println...
Hbase zookeeper запущен, регион-сервер запущен на многоузловом кластере, но hmaster не запускается...
Я пытаюсь отправить задание на пряжу в другой кластер с помощью марафона с помощью контейнера...
Когда я запускаю соединение CTE в Hadoop, это приводит к 0 строкам. WITH cte1 as ( SELECT...
У меня проблемы с попыткой получить доступ к Hadoop для PDA Pentaho. Я провел некоторое...
Я скачал spark версии 2.3.1 и hadoop version 2.7 и java jdk 8. Все отлично работает для простых...
У меня есть около 200k файлов в папке, я хочу организовать их в зависимости от времени рождения...
Я читал статью о том, как небольшие файлы ухудшают производительность запроса улья....
новичок в Hive, подключен к консоли улья и работает hive> show tables; FAILED: HiveException...