Я новичок в AWS EMR и пытаюсь создать кластер для обработки данных из S3. У меня есть сценарий...
Моя программа выполняет несколько заданий уменьшения карты, по одному на каждую строку параметров в...
У меня есть некоторые данные о HDFS, которые я пытаюсь настроить для запроса через куст.Данные...
Я пытаюсь загрузить / выбрать данные XML.Проблема в том, что я не могу разобрать все теги в xml....
Возникла проблема при создании кластера с одним узлом, где у меня есть ведущий (172.16.x.xx) и...
Мой HBase Get / Put иногда занимает очень много времени.Когда я зарегистрировался в журналах, я...
Я пытаюсь скомпилировать hadoop3.0.0beta1 в ubuntu16.04, но когда я запускаю mvn install, он...
Я использую автономный HBase, и поэтому мне нужно удалить некоторый файл свойств из hbase-site.xml...
Я написал приложение MapReduce, которое работает на 6 узлах компьютеров.Я уверен, что мой алгоритм...
Когда я запускаю задание, выдается ошибка. Container [pid=8278...
Я начинаю с Oozie на работе, и одна из моих задач включает Спецификация координатора Oozie . В...
Предположим, у нас есть база данных mysql lastdb с таблицей person.Эта таблица содержит 4 столбца:...
У меня есть следующая схема выводов public static class RecordMapper extends Mapper<Object, Text...
У меня был один кластер Hadoop с защитой KERBEROS и другой кластер Hadoop без KERBEROS. Можно ли...
У меня 2 кластера Hadoop от Hortonworks. Я хочу использовать команду DISTCP. Как установить...
[вопрос новичка в Hadoop] В настоящее время у меня есть реализация узла с одним узлом hadoop 2.7.2
Использование HAWQ 2.2 с HDP 2.5.3 на Centos 7.3.Планируем обновить до новой версии HAWQ 2.4.Каковы...
По умолчанию YARN агрегирует журналы после завершения приложения.Но я пытаюсь объединить журналы...
Я пытаюсь установить пакет SparkR в R в версии Cloudera 5.14.Я установил JAVA_HOME и SPARK_HOME...
Ниже приведена структура одной из существующих таблиц улья. CREATE TABLE `tablename`( col1 datatype...
Я знаю, что Google BigQuery - это хранилище данных, но считается ли Dataproc, Big Table, Pub / Sub...
Я создал каталог в hadoop и скопировал файл в этот каталог. Теперь яхочу создать внешнюю таблицу...
Если я напишу команду: [hdfs@nnode ~]$ hadoop fs -ls я получу сообщение: ls: `. ': Нет такого файла...
У меня есть таблица, colors в Hive, которая выглядит следующим образом: id cname 1 Blue 2 Green 3...
Как зажигать данные из HDFS в кластере? Как блоки преобразуются в RDD? Допустим, у меня есть...