Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Я использую Zeppelin 0.7.3 с Spark 2.3 в режиме клиента пряжи. Мои настройки: Spark: spark.driver

Simon / 28 июня 2018
0 голосов
1 ответ

У меня есть запрос, который я выполнял в экономном порядке, который занимает очень много времени. Я...

Dotan / 28 июня 2018
0 голосов
2 ответов

Я попытался это решение, чтобы проверить, если строка в подстроке: val reg = ".*\\[CS_RES\\]

vero / 28 июня 2018
0 голосов
1 ответ

я пытаюсь получить последний токен полного пути к файлу, и мой код выглядит как val testUdf = spark

Imi007 / 28 июня 2018
0 голосов
1 ответ

Я - новый корд Scala, у меня есть функция flatMap, которая возвращает объект FlatMappedDStream, это...

Zhang Xin / 28 июня 2018
0 голосов
1 ответ

Я запускаю простое задание зажигания на кластере YARN и мою конфигурацию для yarn-site.xml...

arcticOak2 / 28 июня 2018
0 голосов
2 ответов

Мой UDF сравнивается, если разница во времени между двумя столбцами не превышает 5 дней. Если...

Dan / 28 июня 2018
0 голосов
1 ответ

У меня есть данные в следующем формате: +---------------------+----+----+---------+----------+ |...

Shrashti / 28 июня 2018
0 голосов
1 ответ

Так что вопрос в теме. Я думаю, что я не правильно понимаю работу передела. По моему мнению, когда...

jk1 / 28 июня 2018
0 голосов
3 ответов

Есть ли способ динамически масштабировать объем памяти модуля Pod в зависимости от размера задания...

cryanbhu / 28 июня 2018
0 голосов
2 ответов

Я могу заполнить столбцы числового и строкового типа, используя: masterDF = masterDF.na.fill(-1)...

Sudheer Palyam / 28 июня 2018
0 голосов
1 ответ

По отношению к памяти кучи. Spark потребляет больше кучи памяти сравнительного Hadoop. Пожалуйста,...

user8106134 / 28 июня 2018
0 голосов
0 ответов

У меня есть задание Spark 2.2, написанное в pyspark, которое пытается прочитать 300BT данных...

Costas Piliotis / 27 июня 2018
0 голосов
1 ответ

Я установил многоузловой кластер HDP с Spark и Yarn на EC2 Все узлы являются узлами данных. Node3...

tricky / 27 июня 2018
0 голосов
0 ответов

Я реализовал внутреннее соединение, используя Java API Spark. Ожидается, что из двух наборов данных...

anukuls / 27 июня 2018
0 голосов
0 ответов

У меня проблема при попытке загрузить файл ORC / Parquet в spark (2.2), который находится по пути,...

Mareike Hoeger / 27 июня 2018
0 голосов
2 ответов

У меня есть 2 набора данных, и я хочу создать набор данных объединения, поэтому я сделал...

Svg_af / 27 июня 2018
0 голосов
3 ответов

Для справки: я решил эту проблему, добавив Netty 4.1.17 в hadoop / share / hadoop / common...

wordsmith / 27 июня 2018
0 голосов
1 ответ

Я запускаю искровые задания на Yarn на EMR 5.14 (hadoop 2.8.3). Могу ли я использовать улучшенную...

Yann Moisan / 27 июня 2018
0 голосов
1 ответ

1 потоковое и Kafka брокер версии 0.8.2.1, у меня есть отдельные серверы для спарк и кафка на AWS....

SLU / 27 июня 2018
0 голосов
0 ответов

У меня искровой структурированный поток, как - Обратите внимание, что есть и другие столбцы, но я...

Ishan / 27 июня 2018
0 голосов
1 ответ

У меня есть список искровых фреймов данных, и я должен выполнить с ними некоторую операцию Я хочу...

Gladiator / 27 июня 2018
0 голосов
1 ответ

Я создал образ докера моего приложения, когда я просто запускаю его из скрипта bash, он работает...

Cassie / 27 июня 2018
0 голосов
0 ответов

У меня есть 2 кадра данных. df1: |AusID|ProjectId| +-----+---------- |529 |20034 | |973 |20035 |...

Waqar Ahmed / 27 июня 2018
0 голосов
0 ответов

Я видел много статей о памяти / ядрах / экземплярах исполнителя, но я все еще не понимаю, что мне...

Yong Hyun Kwon / 27 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...