Привет Я пытался придумать модифицированную версию стандарта WordCount v1.0 при этом я читаю все...
когда я набираю pig на терминале cloudera, он не запускается. Я получил следующую ошибку....
Как мы все знаем, большая трудность в изучении больших данных состоит в том, что трудно получить...
Я могу подключиться к системе управления Mapr - MCS - порт 8080 (веб-интерфейс), но где я могу...
Я хотел знать, есть ли какой-нибудь способ использовать информацию метаданных, уже присутствующую в...
У меня Mac, и у меня есть несколько запросов sql spark, которые мне нужно выполнить для данных улья...
Попытка собрать Spark 2.4.3 из источника с текущим Hadoop 3.1.2 (в CentOS 7.5):
У меня есть четыре физических узла с установленным докером на каждом из них. Я настроил Mesos,...
Мне кажется, у меня довольно простой вопрос. Я использую кластер Hadoop, размещенный на Unix-машине
Мне нравится узнавать об окну каталогов моего кластера.Я знаю, что это легко, но мне нравится...
Я запускаю простую программу подсчета слов на одном узле, используя Hadoop.Но когда я пытаюсь...
Я использую Ranger V1.2.0.Я настроил LDAP с Ranger.Я могу видеть пользователей и группы от LDAP до...
В режиме развертывания клиента «spark» драйвер spark не использует ядра, а только приложения spark....
Я сейчас пытаюсь загрузить большой CSV в Apache hbase.CSV имеет ширину 50 000 столбцов и 15 000...
У нас есть кластер Kafka со следующими сведениями 3 машины kafka 3 сервера zookeeper У нас также...
На Eclipse, при настройке spark, даже после добавления внешних jar-файлов для построения пути к...
Я пытаюсь получить доступ к нескольким экземплярам COS, которые находятся под одной учетной записью...
Пытаюсь загрузить вкладку разделенный файл HDFS ( 3.5G ) с 45-миллионной записью в HBASE, используя...
Свойство репликации Hadoop не работает из кода зажигания У меня есть сценарий использования, для...
Я хочу установить полностью распределенный HBASE, но после запуска start-hbase.sh я не могу...
Я запускаю искру в режиме кластера, поверх YARN.Цель состоит в том, чтобы запустить Spark-Bench...
Вопросы, связанные с ядрами и исполнителями, задаются несколько раз в SO. Apache Spark: количество...
В коде я использую SerializationUtils от Apache Commons Lang3. SerializationUtils.serialize() для...
Я использую кластер cloudera hadoop и случайно удалил несколько важных папок / файлов из одного...
Я установил Apache Kylin в образ HDP Sandbox от Hortonworks.После этого я подключил Apache Kylin к...