У меня есть несколько паркетных файлов, которые я прочитал в потоковом приложении Flink, чтобы...
У меня есть таблица с NaN в поле, которое является двойным. Я просто хочу посчитать, сколько...
Были заданы похожие вопросы ( здесь и здесь ), но мой вопрос отличается тем, что мне интересно,...
Когда я пытаюсь прочитать файл паркета из указанного места, например / test, с помощью spark.read
У меня есть сценарий использования для копирования последнего сгенерированного файла HDFS на...
Как переместить данные RDBMS 50 ГБ в hadoop и обработать их? Каковы минимальные требования к...
Я установил pyarrow и хотел бы подключиться к файлу hdfs в кластере Hadoop.У меня следующая строка,...
sqoop import-all-tables в hive с базой данных по умолчанию работает нормально, но Sqoop...
Я пытаюсь установить hadoop на ubuntu в псевдораспределенной среде. start-dfs.sh (выдает ошибку)...
У меня есть кластер EMR, который будет запускать долго работающее приложение Spark через действие...
Я пытаюсь изменить специальный символ (Þ) для; но из hdfs не найден. Команда, которую я использовал...
Я хочу прочитать данные в формате csv с сервера hdfs, но он выдает исключение, как показано ниже:...
Я пишу скрипт Scala Spark, в котором я храню (разделы Hive) пути HDFS в качестве ключей, а их...
У меня ошибка при попытке скопировать текст для скачивания (words.txt) пробовал другой синтаксис,...
Я пытаюсь получить доступ к webhdfs в кластере hadoop, работающем под управлением Cloudera, с...
Я пытаюсь сохранить данные из фрейма данных Spark в HDFS, используя схему Avro, хранящуюся в...
Краткое описание проблемы: У меня есть случайный случай использования для записи> 10 ГБ данных в...
Получение ошибки при запуске задания искры из куста CLI jdbc: hive2: //hdpworker.kyvostest.com:...
Я использую org.apache.hadoop.fs, чтобы проверить, пуст ли каталог в HDFS или нет.Я посмотрел...
Я запускаю рабочий процесс oozie с некоторыми bash-скриптами в среде hadoop (Hadoop 2.7.3).но мой...
Как определить дисковое пространство, используемое для определенного шаблона каталога, с помощью...
Как определить использование диска для конкретного шаблона каталога с помощью команды hdfs без...
Для состояния кучи flink, контрольная точка для hdfs будет стоить много времени или зависать, когда...
я новичок в hadoop, я создал каталог, используя hadoop fs -mkdir -p /user/vinayak , где находится...
Я создаю внешнюю таблицу, используя Serde org.apache.hive.hcatalog.data.JsonSerde Местоположение...