Я запускаю Spark на кластере из 8 узлов с пряжей в качестве менеджера ресурсов. У меня есть 64 ГБ...
Я пытаюсь импортировать таблицу с сервера SQL в Hive, но выдает ошибку ниже: ERROR tool.ImportTool:...
В настоящее время, пытаясь преобразовать сценарий, который я сделал из pandas, в pyspark, у меня...
Я искал решение о том, как разделить фрейм данных на основе значений столбцов с идентификатором...
У меня есть три узла hasoop кластера. A B C A Мастер B раб C раб Если я захочу сделать C ведущим, а...
Если я сделаю select * from table1;, в котором данные для заказа будут извлечены Порядок файлов или...
У меня ошибка при попытке скопировать текст для скачивания (words.txt) пробовал другой синтаксис,...
Я пытаюсь получить доступ к webhdfs в кластере hadoop, работающем под управлением Cloudera, с...
Я слышал, что задача карты сохраняет свои данные на диске. Но это замедлит отображение, особенно...
У нас есть несколько конфигураций для ограничения количества рабочих потоков в Hive Metastore...
Краткое описание проблемы: У меня есть случайный случай использования для записи> 10 ГБ данных в...
Я пишу приложение для структурированной потоковой передачи Spark, в котором данные, обрабатываемые...
Я использую Livy rest api для отправки искровых заданий с использованием s3a вместо HDFS.Я пишу АК...
Я использую org.apache.hadoop.fs, чтобы проверить, пуст ли каталог в HDFS или нет.Я посмотрел...
Этот сценарий выводит размер базы данных в ГБ, а также путь к базе данных.$ 1/1024/1024/1024...
Каждая строка моих данных - это конкатенация года и нескольких символов.Я хочу получить первые 3...
Я использую Hive 1.1.0 и вижу, что для двух bigint столбцов active_users и inactive_users,...
Я запускаю рабочий процесс oozie с некоторыми bash-скриптами в среде hadoop (Hadoop 2.7.3).но мой...
Как определить дисковое пространство, используемое для определенного шаблона каталога, с помощью...
Как определить использование диска для конкретного шаблона каталога с помощью команды hdfs без...
Я пытаюсь выяснить, как перезапустить задание запуска, когда оно завершается неудачно с ненулевым...
Возможно ли иметь два значения в MapReduce? Мой CSV выглядит так: month, date, deviceCategory,...
Я использую IntelliJ ide и язык scala, я хочу получить доступ к текстовому файлу, хранящемуся в AWS...
У меня есть скрипт, который напрямую требует создания баз данных impala с использованием дефиса в...
Я новичок в бигдате и улье. Нужно работать с другим разработчиком приложения для потокового...