До сих пор я узнал, что использование yarn jar .... переводит мою работу MR в менеджер ресурсов и...
У нас есть таблица Hive, как показано ниже: Мы хотели бы видеть вывод, как показано ниже: Для...
Как настроить конфигурацию запуска приложения, чтобы использовать собственный файл core-site.xml...
Предполагается, что местоположение S3 с необходимыми данными имеет вид:...
Сбой Oozie со следующей ошибкой, когда workflow.xml предоставляется из s3, но то же самое сработало...
У меня следующая проблема.Я добавил jive jars в java action of oozie с использованием разделяемой...
Я использую spark 1.6 и пытаюсь создать файл с разделителями из фрейма данных. Разделителем полей...
Я новичок в Hadoop и с последних нескольких часов пытаюсь заставить его работать на моей машине.В...
У меня есть данные, как показано ниже.поэтому я хотел бы сгруппировать по году, имени и первому...
У меня на компьютере уже установлен Yarn (менеджер пакетов), но теперь мне нужно установить Apache...
Я использую Spark 2.4.0 с Hadoop 2.7, hadoop-aws 2.7.5 для записи наборов данных в файлы паркета на...
Я пытаюсь понять, почему следующий подзапрос будет работать в Impala, а не в Hive. select * from...
У меня есть кластер Hadoop с несколькими рабочими, и я хочу обрабатывать свои данные в улье с...
У моей установки есть YARN, работающий с Kerberos и включенным SSL в небольшом кластере HDP 3.1 с...
Мы установили Presto в кластере Hadoop (Ambari кластер с 24 машинами узлов данных). Presto был...
Программное обеспечение, которое я использую: Система: macOS Mojave 10.14.2 Hadoop: 3.1.1 JDK: 10.0
У меня есть список ожидающих процедур HBase.Я хочу откатить все это.Как я могу это сделать?Вывод...
В определенный момент моего кода у меня есть два разных типизированных набора данных.Мне нужны...
У меня есть много CSV spark.readStream в разных местах, я должен проверить все их с помощью scala,...
Я установил версию hadoop 2.9.2, после запуска всех служб jps команда не показывает вывод. Я не...
Я знаю, что у нас есть доступ на уровне столбцов в Apache Sentry.Но возможно ли обеспечить доступ...
Сделал запрос для записей csv из stackexchange - здесь .Запрос дает мне около 50000 записей....
Я слушаю кластер hdfs на 192.168.50.1:9000, что означает, что он принимает соединения только через...
Из новой среды (клиента) я бы хотел подключить HDFS через импалу, которая является удаленным...
Скажем, у меня есть таблица в Hive с именем T1.Он разделен на столбец dt, который является полем...