Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Операция сохранения искровых данных выполняется довольно медленно, если: кадр данных df,...

conderls / 14 февраля 2019
0 голосов
1 ответ

У меня есть JavaPairRDD, на котором я хочу выполнить итерацию, выполнить некоторую операцию и...

Sam / 14 февраля 2019
0 голосов
0 ответов

Я пытаюсь извлечь данные из таблицы на основе объединения с данными, поступающими из потока. Запрос...

Arun Tyagi / 14 февраля 2019
0 голосов
0 ответов

Я использую spark 2.3.0 и пытаюсь передать ключ файла свойств в xpath, чтобы получить значение из...

Arun Mohan / 14 февраля 2019
0 голосов
1 ответ

Сбой задания Pyspark, когда я пытаюсь сохранить DataFrame, созданный в таблице размером ~ 270 ГБ, с...

Sam / 14 февраля 2019
0 голосов
0 ответов

Я построил искру 2.3.2 из источника в системе с прямым порядком байтов.Я наблюдал следующий сбой...

Ravi _SS / 14 февраля 2019
0 голосов
0 ответов

Я выставил набор функций поддержки в библиотеку helper.jar и импортировал в кластер Databricks.Jar...

Dan / 14 февраля 2019
0 голосов
0 ответов

Я вижу правильный вывод записей при локальном запуске.Однако, когда я работаю в кластере, результат...

Nathan Ronsse / 14 февраля 2019
0 голосов
0 ответов

Веб-интерфейс диспетчера ресурсов YARN имеет столбец «Ход выполнения».Это значение не обновляется...

Aleks Ya / 13 февраля 2019
0 голосов
0 ответов

У меня есть требование, в котором мне нужно вычислять количество определенных значений на сегодня,...

riyaB / 13 февраля 2019
0 голосов
0 ответов

Я запускаю приложение Spark из файла jar.Когда я определяю в log4j пользовательский файл и запускаю...

Cassie / 13 февраля 2019
0 голосов
1 ответ

У меня есть DataFrame df4 с тремя столбцами id аннотирующая сущность data с данными массива JSON...

user811602 / 13 февраля 2019
0 голосов
1 ответ

Сортировка по Spark SQL приводит к узкой зависимости. Сортировка API набора данных и упорядочение...

Vinay K L / 13 февраля 2019
0 голосов
0 ответов

Я получаю следующую проблему, когда присоединяюсь к 2 DF в потоковой передаче искры.Не могли бы вы...

Indira / 13 февраля 2019
0 голосов
1 ответ

У меня серьезная проблема с производительностью искрового потока.Для 10-секундного интервала...

Indira / 13 февраля 2019
0 голосов
0 ответов

Я хочу вычислить агрегаты транзакций в Scala Spark.Так, например, среднее значение всех транзакций...

Robin Vu / 13 февраля 2019
0 голосов
0 ответов

Я использую Spark Structured Streaming в Databricks.Мой код выглядит так: rawEvents .as[EventRow]

guiferviz / 13 февраля 2019
0 голосов
1 ответ

У меня есть DataFrame с двумя столбцами в качестве «ключа»: id1 и id2: val df1 = Seq( (1, 11,...

user811602 / 13 февраля 2019
0 голосов
2 ответов

У меня есть датафрейм, как показано ниже: group value B 2 B 3 A 5 A 6 Теперь мне нужно вычесть...

LUZO / 13 февраля 2019
0 голосов
1 ответ

Я знаю, что этот вопрос уже задавался несколько раз, но ни один из ответов не помог в моем случае....

dexter007 / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь создать JSON из моего фрейма данных pyspark.Я вижу в моем фрейме данных данные...

Shankar Panda / 13 февраля 2019
0 голосов
1 ответ

Я изучаю PySpark.Из https://spark.apache.org/docs/2.2.0/ml-pipeline.html, есть пример: from pyspark

Feng Chen / 13 февраля 2019
0 голосов
1 ответ

Проблема: учитывая, что данные временного ряда, которые являются потоком кликов по активности...

Arghya Saha / 13 февраля 2019
0 голосов
0 ответов

Я использую следующий код для загрузки данных из HDFS: spark .read .option("header",...

Miguel A. Friginal / 13 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...