Вопросы с тегом пряжа

0 голосов

0 ответов

Увидит ли мой искровой аккумулятор все записи, написанные исполнителями?

В следующем коде гарантированно выполняется цикл BLOCK 2 только после того, как все задачи...

codebox / 29 ноября 2018

0 голосов

0 ответов

Пряжа: добавление пользовательских log_file_type

У нас есть требование, в котором мы хотим создать несколько файлов журнала для задания MapReduce на...

sud29 / 29 ноября 2018

0 голосов

1 ответ

Apache Spark DAG Визуализация в формате json / text

Я смотрел на оптимизацию некоторых довольно больших заданий Apache Spark и заметил, что...

krish7919 / 28 ноября 2018

0 голосов

0 ответов

Ошибка при запуске curl при попытке получить статистику Yarn

Я установил виртуальную машину на своем ноутбуке и пытаюсь подключиться к хосту, на котором...

akash sharma / 28 ноября 2018

0 голосов

1 ответ

Контейнер запуска пряжи не удался с привилегией

Стек: Ambari 2.4.2.0, HDP 2.5.3.0, CentOS 6.8, FreeIPA 3.0.0 Когда я пытаюсь использовать...

alan / 27 ноября 2018

0 голосов

0 ответов

IP-адрес клиента на Yarn Resource Manager

Как проверить IP-адрес хоста (клиента), который отправляет задание менеджеру ресурсов пряжи (на...

Shikhar Upadhyay / 27 ноября 2018

0 голосов

1 ответ

spark-submit --files hdfs: // файл кэшируется в / tmp на драйвере

Я использую spark-submit следующим образом: spark-submit --deploy-mode client --master yarn --conf...

maffe / 27 ноября 2018

0 голосов

0 ответов

Запустите Spark на YARN без искры-отправки, но с Java

В кластере HDP 2.4 Hadoop с YARN мне интересно, возможно ли запустить программу Java Apache Spark...

Thomas Decaux / 26 ноября 2018

0 голосов

1 ответ

Hadoop - не удалось указать основное имя сервера Kerberos

Ошибка - не удалось указать имя участника Kerberos сервера Я пытаюсь настроить кластер Hadoop с...

Edward Dunn / 26 ноября 2018

0 голосов

1 ответ

Самза контейнер не работает

Здравствуйте, мои контейнеры заданий samza часто дают сбой из-за следующих ошибок : Исключение из...

hitesh / 24 ноября 2018

0 голосов

1 ответ

Что означает Num Off Switch Containers в пользовательском интерфейсе Yarn Resource Manager?

У меня есть работа ETL, занимающая много ресурсов процессора и памяти и работающая в течение...

Aravind R. Yarram / 23 ноября 2018

0 голосов

1 ответ

Расписание приложения YARN на активных / резервных узлах

Я хотел бы иметь кластер, который разделен на 2 подкластера: «активные» узлы и «резервные» узлы

Shay / 22 ноября 2018

0 голосов

3 ответов

Многоузловой кластер Hadoop слишком медленный.Как увеличить скорость обработки данных?

У меня кластер из 6 узлов - 5 DN и 1 NN.Все имеют 32 ГБ оперативной памяти.Все рабы имеют жесткий...

Rishabh Dixit / 21 ноября 2018

0 голосов

0 ответов

Невозможно найти файлы .jhist (история заданий) для заданий Tez

Я настроил tez 0.8.4 поверх Hadoop 2.7 и запускаю на нем несколько tez-заданий.Мне нужны файлы

user3103013 / 21 ноября 2018

0 голосов

1 ответ

Запрос на пряжу и искру

Мне нужно использовать spark для экспорта данных из Hive (с разделами) в Teradata (без разделов)....

Rony / 20 ноября 2018

0 голосов

1 ответ

(Linux AMI) EMR Cluster версия команды `free`

Я пытаюсь выделить память для запуска при запуске pyspark из AWS Linux AMI - т.е. передать точные...

d8aninja / 20 ноября 2018

0 голосов

0 ответов

Автоматическое масштабирование Spark Streaming не всегда действует даже при наличии доступных ресурсов

Я пытаюсь настроить автоматическое масштабирование для наших заданий Spark Streaming, выполняющихся...

noobNeverything / 20 ноября 2018

0 голосов

0 ответов

Есть ли способ отключить запись файла .jhist для MapReduce?

У меня небольшой кластер с не очень хорошей сетью.Время от времени длительное задание будет...

Jahwffrey / 18 ноября 2018

0 голосов

0 ответов

Невозможно запустить dfs / yarn в hadoop 3.1.1

Я скачал hadoop 3.1.1 и внес все изменения в конфигурацию, строка: sudo hdfs namenode -format...

Saurabh / 16 ноября 2018

0 голосов

2 ответов

Oracle PGX на пряже - 404 на веб-сервисе

Я использую Yarn на Oracle BDA X7-2, спецификации: Cloudera Enterprise 5.14.3 Java 1.8.0_171 PGX 2

Samamba / 13 ноября 2018

0 голосов

1 ответ

Включение, планирование CPU в YARN действительно улучшит параллельную обработку в искре?

YARN с планировщиком емкости будет учитывать только память при выделении ресурсов для...

Dharaneesh Vrd / 12 ноября 2018

0 голосов

1 ответ

Улей: Mapreduce Файл отсутствует

Я могу ввести Hive-cli и создать новые таблицы. Тем не менее, когда я пытаюсь вставить данные в...

user2894829 / 12 ноября 2018

0 голосов

0 ответов

искра - как узнать, какой исполнитель потерпел неудачу во время выполнения задания и избежать их?

фон: Я запускаю искровую работу в огромном кластере с большими рабочими нагрузками, в котором...

skywalkerytx / 11 ноября 2018

0 голосов

1 ответ

Spark: использование параметра драйвера-памяти

Когда я отправляю эту команду, моя работа завершилась с ошибкой «Контейнер работает за пределами...

andret8 / 09 ноября 2018

0 голосов

0 ответов

Как указать версию спарк в Execution Launcher

Я пытаюсь запустить приложение pyspark в режиме клиента пряжи. Локальная искра версии 2.3.0 с...

Sergii V. / 07 ноября 2018