Вопросы с тегом пряжа

0 голосов

0 ответов

Что происходит с искровыми приложениями, запрашивающими больше памяти, чем у кластера?

Если есть искровой кластер с рабочими узлами, скажем, x GB памяти, и есть 5 таких рабочих узлов,...

Sayantan Ghosh / 15 апреля 2019

1 голос

1 ответ

Операция подсчета, приводящая к большему количеству pyspark rack_local

Я пытаюсь понять уровень локальности кластера Spark и его связь с количеством разделов RDD вместе с...

bohr / 12 апреля 2019

0 голосов

2 ответов

Улей застрять в запросах, в чем может быть проблема?

Я установил Hive, и он правильно выполняет основные запросы, но застревает для запросов, таких как...

nikita parab / 12 апреля 2019

1 голос

1 ответ

Почему я не могу изменить значение "spark.driver.memory" в AWS Elastic Map Reduce?

Я хочу настроить свой искровой кластер на AWS EMR, и я не могу изменить значение по умолчанию spark

yassidhbi / 11 апреля 2019

0 голосов

0 ответов

Hadoop 3.1 на macOS: пряжа не работает? (Менеджер ресурсов и менеджер узлов)

Я пытался установить Hadoop на macOS.Я могу запустить hdfs через ./start-dfs.sh, но ./start-yarn.sh...

Keru Wu / 10 апреля 2019

0 голосов

0 ответов

Spark on YARN - Spark-Submit, не справляясь каждый раз с банками

Я получил небольшой кластер из 5 компьютеров на базе Hadoop / YARN и Spark сверху.Я хочу выполнить...

Hendrik Jaenzoffski / 05 апреля 2019

0 голосов

0 ответов

Как ограничить использование памяти пользователем в кластере Hadoop?

Я использую мультитенантное решение, размещенное в EMR, в котором работает Spark Cluster. Многие...

ebertbm / 04 апреля 2019

2 голосов

1 ответ

Apache Spark Executors Dead - это ожидаемое поведение?

Я запускаю конвейер для обработки моих данных в Spark.Кажется, что мои Исполнители время от времени...

Augusto / 04 апреля 2019

1 голос

1 ответ

Почему spark num-executors не равен пряжевым контейнерам?

Согласно [ Spark на менеджере ресурсов YARN: отношение между контейнерами YARN и исполнителями...

sgu / 03 апреля 2019

0 голосов

1 ответ

получить IP-адрес главного узла emr из пряжи

Чтобы получить список IP-адресов подчиненных узлов emr, необходимо выполнить следующий код: yarn...

Walrus the Cat / 02 апреля 2019

0 голосов

1 ответ

Драйвер Spark получает OutOfMemory

Я использую искровой кластер, где я сталкиваюсь с OutOfMemory в программе драйвера.но после того,...

Sayantan Ghosh / 02 апреля 2019

0 голосов

0 ответов

Spark не распределяет исполнителей одинаково

в настоящее время я использую огромный spark streaming application (который читает и пишет в kafka)...

restfulblue / 01 апреля 2019

0 голосов

0 ответов

Как отправить mapreduce задание удаленно

Я настроил кластер hadoop2 и могу отправить пример задания wordcount с помощью команды hadoop jar....

ZhangKe877 / 01 апреля 2019

1 голос

0 ответов

HBase соединение отказано после случайных задержек

Я успешно установил один узел Hadoop и Hbase .Я использую Java-агент для подключения к Hbase.После...

sachith / 01 апреля 2019

0 голосов

0 ответов

Установить имя для идентификатора приложения в веб-консоли пряжи

Я запускаю два hiveql с простым предложением выбора.Когда файлы hiveql предоставлены для работы, я...

dominicrd / 01 апреля 2019

0 голосов

0 ответов

Режим клиента Spark Yarn: контекст Spark остановлен во время ожидания бэкэнда

У нас есть спарк на кластере пряжи, и я пытался создать спаркконтекст в режиме клиента из...

Fatemeh Rouzbeh / 30 марта 2019

0 голосов

1 ответ

Oozie Spark2 Java Action: Как завершить работу

Я перевожу существующие конвейеры с версии 1.6.0 на версию 2.1.0 (cdh 5.15.1). Версия oozie,...

sudharshan r / 30 марта 2019

0 голосов

0 ответов

Ошибка Hadoop при запуске NodeManager с исходным кодом Hadoop 2.8.5

Я хочу запустить hadoop в Intellij IDEA из исходного кода, и я запустил hdfs, запустив основные...

Guohao Ding / 30 марта 2019

0 голосов

0 ответов

aws emr добавить ограничение шага;Могу ли я выполнять шаги параллельно?

У меня есть куча заданий SQOOP, которые я хотел бы запустить через EMR add-step.Мой существующий...

Manas / 29 марта 2019

0 голосов

1 ответ

В чем разница между службой временной шкалы пряжи и сервером истории MR2

В hadoop2 есть сервис временной шкалы, используемый для пряжи, а также сервер истории MRV2, так в...

robin_ch / 28 марта 2019

0 голосов

0 ответов

Hadoop: разница между "местным" и "пряжей"

Я проверил много постов здесь, но не могу найти правильный ответ на свой вопрос. На самом деле я не...

brest1007 / 25 марта 2019

0 голосов

0 ответов

Spark executor потерян при увеличении количества экземпляров executor

Мой кластер Hadoop в настоящее время имеет 4 узла и 45 ядер, на которых запущен pyspark 2.4 через...

Mahmoud Odeh / 21 марта 2019

1 голос

0 ответов

ОШИБКА сжатия Hadoop: java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy () Z

Когда я запускаю Apache Kylin на Hadoop, я встретил следующую ошибку, связанную с Hadoop MapReduce:...

Yanwen Lin / 20 марта 2019

0 голосов

1 ответ

Предложения, необходимые для увеличения использования контейнеров пряжи в нашем кластере обнаружения

Текущая настройка у нас есть наш кластер обнаружения из 10 узлов. Каждый узел этого кластера имеет...

akash sharma / 20 марта 2019

2 голосов

0 ответов

Управление кластером и использованием пряжи

В нашем кластере минимальный размер контейнера равен 8 ГБ. большинство запросов улья используют 1...

Kumar / 19 марта 2019