В Hive, как я могу заменить несколько пробелов между строками? select regexp_replace('foot...
У меня есть строка длиной 10, и я хочу найти определенный набор символов для каждого символа с...
Я установил Hadoop 2.9.0 .Я проверил jps в подчиненных узлах, работает datanode и nodemanager в...
У меня есть 4-х узловый кластер hadoop с 2 главными узлами и 2 узлами данных.У меня много файлов в...
Есть ли какой-нибудь надлежащий ресурс, из которого мы можем полностью понять план объяснения,...
У меня есть работа, которая переносит данные из оракула в hdfs.Мне нужен эффективный способ...
Когда задание отправлено, когда YARN и NameNode взаимодействуют?Когда работа отправляется, кому она...
Можно ли рассчитать общий размер файла в каталоге файлов HDFS в ГБ или МБ?Я не хочу использовать...
У меня есть таблица Hive, разделенная по годам / месяцам, и она содержит данные как минимум за 7...
Я экспортирую данные HDFS файла департаментов_экспорта, представленных в каталоге HDFS в каталоге /...
У меня есть настройка Docker Swarm для узлов данных HDFS следующим образом (усечено): datanode:...
Я пытаюсь прочитать данные из "s3: //fakePath/subFakePath/sub-sub-FakePath/*.gz" в искру,...
Я хотел бы знать: возможно ли интегрировать Apache Hadoop или MapReduceFramework в среду...
Есть ли способ получить Hadoop FileSystem от Spark Executor при выполнении операции mapPartitions...
Я новичок в Cloudera и пытаюсь перенести рабочие нагрузки с HDP-сервера под управлением Ambari с...
Я использую EMR 5.4 и отправляю искровое задание в Yarn Когда я пытаюсь получить журнал с yarn logs...
Как создать таблицу кустов из файла, содержащего данные в форме Карта (ретвит -> 0, местоположение...
Я пытаюсь запустить программу в кластере, используя YARN. YARN присутствует там вместе с HADOOP....
Мне нужно сравнить файлы CSV, а затем удалить все дублирующиеся строки.Итак, мое состояние таково,...
Когда я запускаю пример wordcount в hadoop, я получаю это исключение (но в последний раз, когда я...
Я сейчас немного борюсь с MapReduce.У меня есть следующий набор данных: 1,John,Computer 2,Anne...
Текущая версия кластера out hadoop - 2.6.0-CDH5.10.0, и мы хотим обновить ее до 3.0.0. Существуют...
На сайте H2O написано, что Основной код H2O написан на Java.Внутри H2O хранилище распределенного...
В сеансе PysPark я хочу скопировать файл из S3 в локальный каталог Hadoop Cluster, при этом...
Я пытаюсь отредактировать конфигурацию размера блока hadoop через оболочку spark, чтобы...