Вопросы с тегом пряжа

0 голосов

0 ответов

Приложение application_1561548360472_0002 не удалось 2 раза из-за AM-контейнера для appattempt_1561548360472_0002_000002, завершенного с exitCode: 1

Я запускаю простую программу подсчета слов на одном узле, используя Hadoop.Но когда я пытаюсь...

ksanjay / 27 июня 2019

0 голосов

0 ответов

Генерация данных с помощью Spark-Bench не выполняется параллельно

Я запускаю искру в режиме кластера, поверх YARN.Цель состоит в том, чтобы запустить Spark-Bench...

user9332151 / 26 июня 2019

0 голосов

1 ответ

отправить искровое задание из локальной конфигурации в emr ssh

Я новичок в искре.Я хочу отправить искровое задание из локального в удаленный кластер EMR.Я...

yabchexu / 26 июня 2019

0 голосов

0 ответов

Как получить сервис-данные в ApplicationMaster

service-data - необязательное поле, которое можно передать в am-container-spec.Но я не могу найти...

mzhang / 26 июня 2019

1 голос

2 ответов

Spark не использует правильную конфигурацию из core-site.xml

Когда я пытаюсь прочитать файл паркета из указанного места, например / test, с помощью spark.read

Hypnotise / 25 июня 2019

0 голосов

0 ответов

Как запустить тест tpc-h с искрой на вершине пряжи?

Я хочу запустить тест tpc-h с искрой на вершине пряжи, я могу генерировать данные, но не используя...

user9332151 / 24 июня 2019

0 голосов

1 ответ

Как исправить эту фатальную ошибку при запуске искровых заданий в кластере HDIinsight?Сессия 681 неожиданно достигла окончательного статуса «мертвый».Смотрите журналы:

Я запускаю код pyspark на HDIcluster и получаю эту ошибку: Код не выполнен из-за неустранимой...

BANDI HEMANTH / 22 июня 2019

0 голосов

0 ответов

Союз из 20 наборов данных всегда OOMs драйвер Spark

У меня довольно простая искровая работа, которая объединяет несколько наборов данных. Код примерно...

Carl Ambroselli / 21 июня 2019

0 голосов

1 ответ

Как убить искровую работу из ps -ef программно

Я хочу убить искровую работу программно. Ниже приведен сценарий: Когда я убиваю искровую работу с...

Saurabh Deshpande / 20 июня 2019

3 голосов

1 ответ

Используйте промежуточный каталог GCS для заданий Spark (на Dataproc)

Я пытаюсь изменить промежуточный каталог Spark, чтобы предотвратить потерю данных при выводе...

Fred Rouvier / 20 июня 2019

0 голосов

1 ответ

Как мы можем ограничить использование VCores во время Spark-submit

Я пишу приложение для структурированной потоковой передачи Spark, в котором данные, обрабатываемые...

Manish Saraf Bhardwaj / 19 июня 2019

0 голосов

0 ответов

Выполнение искровых заданий в режиме кластера

Я пытаюсь запустить приложение pyspark в режиме кластера с помощью следующей команды spark-submit...

syv / 18 июня 2019

0 голосов

0 ответов

Как перезапустить искровое задание, когда оно завершается неудачно с ненулевым состоянием выхода

Я пытаюсь выяснить, как перезапустить задание запуска, когда оно завершается неудачно с ненулевым...

AV94 / 18 июня 2019

0 голосов

0 ответов

Как получить пряжу application_id индивидуального запроса улья, отправленного из рабочей среды HUE?

Мы используем HUE для выполнения запросов улья, так как мы знаем, что в панели HUE пользователь...

Shashank Mishra / 18 июня 2019

1 голос

0 ответов

Очистка истории искровой потоковой передачи на кластере emr

Я ссылался ниже на ссылки и сделал те же изменения https://aws.amazon

Manoj Kumar Dhakd / 17 июня 2019

1 голос

1 ответ

Hadoop3: ошибка рабочего узла при подключении к ResourceManager

У меня есть 3-х узловый кластер hadoop (капли DigitalOcean): hadoop-master настроен как namenode и...

FlyinDoji / 15 июня 2019

0 голосов

0 ответов

Регистрация Pyspark в режиме кластера пряжи

Я запускаю искровое задание в режиме кластера пряжи и не могу сохранить журналы в файле.Я использую...

Deepak Sharma / 15 июня 2019

0 голосов

1 ответ

Требуется ли установить спарк на всех узлах кластера?

Я новичок в Spark и изучаю архитектуру.Я понял, что spark поддерживает 3 менеджера кластера, таких...

Niketa / 14 июня 2019

0 голосов

1 ответ

Hadoop: использование пряжи и локальной памяти

Если мы зарезервируем 80% памяти для пряжи, а затем по какой-то причине допустим утечку памяти,...

54l3d / 13 июня 2019

0 голосов

1 ответ

dask-yarn в кластере: невозможно подключиться к приложению

Я пытаюсь использовать dask-yarn для распределения заданий Python в кластере. Я использую следующий...

Nik Berry / 12 июня 2019

0 голосов

0 ответов

Результаты JPS и отчет администратора hdfs отличаются

Вот мои результаты jps на главном узле. NameNode SecondaryNameNode И вывод подчиненного узла jps...

Beyhan Gül / 12 июня 2019

0 голосов

0 ответов

как убрать hdfs в менеджере пряжи

Все подчиненные узлы в кластере пряжи отслеживают блоки в hdfs blk_1073742325_1505.meta....

Raj / 10 июня 2019

0 голосов

0 ответов

Задание dmlx XGBoost застряло в Yarn в состоянии «ПРИНЯТО» при последующей передаче

У меня есть кластер из 3 узлов в AWS (1 ведущий и 2 ведомых) Конфигурации: мастер (8 vCPU, 16 ГБ)...

braj / 10 июня 2019

1 голос

0 ответов

Простое потоковое приложение Spark выделяет всю память в кластере - GCP Dataproc

Простое потоковое приложение Spark без каких-либо значительных вычислений в памяти потребляет 17 ГБ...

Devester / 08 июня 2019

0 голосов

0 ответов

Hadoop Shuffle терпит неудачу. Ошибка контрольной суммы

Мы видим очень медленную фазу копирования: reduce > copy...

Alexander Fedotov / 06 июня 2019