Есть ли команда HDFS, чтобы проверить, имеют ли 2 каталога в HDFS общий родительский каталог....
У меня есть 3 сервера Centos 7 (межсетевой экран и selinux отключены) chadoop1 (ведущий), chadoop2...
У меня есть файл продаж с информацией, такой как название магазина, местоположение, цена продажи,...
Я установил новый кластер HDP 3, используя ambari 2.7. Проблема в том, что служба менеджера...
HDP 2.6 (Платформа данных HortonWorks) не поддерживает Python3.В то время как Python3 (или...
Я настраиваю кластер с одним узлом с аутентификацией Kerberos Узел данных не запускается, n в файле...
Я пытаюсь запросить таблицу Hbase с помощью spark, но я получаю эту ошибку: 14: 08: 35.134 [main]...
Я ищу помощь в получении данных SparkR для прямой загрузки в HBase.Функция чтения работает, когда я...
Я установил Hadoop в OS X, и все шло хорошо.Мой недавний опыт и я прилагаю усилия, чтобы узнать...
Я пытался визуализировать данные hbase kylin-куба.В настоящее время он показывает закодированные...
Перед запуском Pig в режиме уменьшения карты вы всегда должны запустить сервер истории, в то время...
Здравствуйте, я пытаюсь настроить кластер Hadoop в экземпляре AWS EC2. Я скопировал файл sshkey_rsa
Этот вопрос задавался ранее, но я смог найти решение, которое сработало для меня, поэтому я задаю...
Я хочу запустить инструмент Java на данных, хранящихся в кластере Hadoop.Я пытаюсь сделать это,...
Я надеюсь, что кто-то сталкивался с этим! Я заметил, что при использовании 'Not In', где условие в...
Я хочу обновить свой столбец "flag" в моей целевой таблице на "Y" и "N" на основе правил и данных,...
Я установил mapreduce.map.memory.mb 256 МБ и mapreduce.reduce.memory.mb 256 МБ в mapred-site.xml
Ниже приведена команда формата HDFS. sudo bin/hdfs namenode -format Когда я запускаю эту команду, я...
Здравствуйте, я пишу программу mapreduce для вычисления разницы в степени узла между двумя...
Я пытаюсь запустить задачу сокращения цикла, которая записывает вывод в таблицу в cassandra.Мое...
Я пишу программу spark / scala, которая отправляет запрос в athena (использует...
Есть ли какие-либо другие возможности для мониторинга и проверки больших заданий distoop, кластера...
for elem in list: final = sqlCtx.read.table('XXX.YYY') interim = final.join(elem...
В нашем случае мы хотим повторно использовать объект подключения клиента, поэтому мы не закрыли его
Рассмотрим следующий сценарий со следующими шагами: Загрузить файл CSV в HDFS Прочитать этот файл,...