Мое впечатление от очень простых тестов между двумя узлами состоит в том, что тот факт, что HDFS...
У меня есть несколько терабайтных данных, и я хочу проанализировать их в Qt. В локальной системе...
Я не могу понять, как HDFS будет работать внутри контейнера. Контейнеры по замыслу предназначены...
Когда Spark использует программу записи Hadoop для записи файла части (используя saveAsTextFile ())...
Я установил HDFS с помощью Cloudera Manager 5. Затем я попытался просмотреть...
У меня есть паркетный файл в HDFS, размером около 1 ТБ. В настоящее время данные разбиты методом по...
Давайте предположим, что какой-то узел данных выйдет из строя, и он прекратит посылать тактовые...
В кластере hdfs я ежедневно получаю несколько файлов, которые могут быть трех типов: 1)...
Я хочу скопировать данные из таблицы HDFS в hive. Я попробовал приведенный ниже код, но он не...
Мне нужно записать во внешний кластер HDFS, данные аутентификации которого доступны как для простой...
Я использовал Pig и Hive для операций MapReduce с набором данных, который хранится в HDFS. Теперь я...
У меня Hadoop 2.7.1 e он успешно работал. Затем я скачал apache-hive-2.1.1-bin и отредактировал...
У нас для dfs.blocksize установлено значение 512 МБ для одного из заданий сокращения карты, которое...
Я хочу иметь возможность искать шаблон строки во всех папках и файлах в определенном каталоге в...
Я пытаюсь создать сохраненное задание sqoop (в инкрементах) и использовать sqoop metastore в...
Я пытаюсь загрузить некоторые файлы в HDFS с использованием Scala. Тем не менее, я получаю ту же...
У меня есть таблица в формате hdf, которая хранится в текстовом формате, поэтому теперь у меня есть...
Мой вопрос может показаться наивным, но я хотел бы знать, могу ли я добавить все содержимое одного...
Я новичок в Hadoop! Как я могу выполнить некоторые команды hdfs из кода Java? Я успешно тестировал...
при записи многораздельного набора данных в HDFS / S3 файл _SUCCESS записывается в выходной каталог...
Входные сплиты hadoop имеют одинаковый размер , и я знал, что их можно настроить у разработчика. На...
Я пытаюсь записать данные с помощью PySpark с локального на удаленный сервер, и я получаю сообщение...
Я пытаюсь подключить мой Kafka к HDFS, но при запуске конфигурации я получаю следующую ошибку: java
Я пытаюсь создать файлы в HDFS, используя: import org.apache.hadoop.conf.Configuration; import org
В большинстве вопросов / ответов по SO и в Интернете обсуждается использование Hive для объединения...