Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
2 ответов

Я пытаюсь получить данные таблицы улья на оболочке spark, используя spark.sql (""), но он дает...

Prasad / 22 мая 2019
0 голосов
0 ответов

' Я пробираюсь через Graphx In ​​Action и эту книгу. (исходный код для которого здесь:...

Chris Bedford / 22 мая 2019
1 голос
0 ответов

Я новичок в области больших данных. Я пытаюсь прочитать некоторые файлы JSON и сделать анализ, а...

masqueradeSolitude / 22 мая 2019
0 голосов
1 ответ

Невозможно полностью прочитать данные с S3, если чтение происходит сразу после обновления...

user1477175 / 22 мая 2019
0 голосов
1 ответ

Я использую режим кластера Spark Standalone и использую "spark.driver.cores", чтобы...

Sumit Purohit / 22 мая 2019
0 голосов
0 ответов

Я использую pandas_udf, чтобы применить модель машинного обучения к моему искровому кластеру, и...

Jlanday / 22 мая 2019
1 голос
0 ответов

Я работаю над оптимизацией конвейера данных, который использует Apache Spark, HDFS и YARN в...

jewelltaylor9430 / 21 мая 2019
0 голосов
0 ответов

Я пытаюсь сравнить записи из кадра данных, полученного из Redshift, в столбце с одним литеральным...

YannickSSE / 21 мая 2019
0 голосов
1 ответ

У меня есть столбец с массивами в нем: "subscriberPhoneNbrs" : [ { "phoneType"...

Ga999 / 21 мая 2019
0 голосов
1 ответ

Я должен найти, что когда конкретный магазин меняет свой бренд, мне нужно заполнить mthid. Это...

Achyuth / 21 мая 2019
0 голосов
1 ответ

Я только что установил новый Spark 2.4 из CSD на мой CDH кластер (28 узлов) и пытаюсь установить...

mrjoseph / 21 мая 2019
1 голос
1 ответ

Как правильно указать интервал окна в Spark SQL, используя две предопределенные границы? Я пытаюсь...

ezamur / 21 мая 2019
0 голосов
1 ответ

Вот мое точное требование. Я должен добавить новый столбец с именем ("DAYS_TO_NEXT_PD_ENCOUNTER")....

Premkumar / 21 мая 2019
1 голос
1 ответ

В Azure HDInsight выполняется задание на запуск, которое выполняет некоторые преобразования данных...

GANdalf85 / 21 мая 2019
0 голосов
2 ответов

Предположим, у меня есть кадр данных, который выглядит следующим образом: val df2 =...

Borja_042 / 21 мая 2019
0 голосов
0 ответов

Я хочу обучить несколько моделей Spark ML одновременно, используя каждое подмножество одного набора...

aptekaY / 21 мая 2019
3 голосов
1 ответ

Я тестировал с режимом кластера искровой нити.Задание на запуск выполняется в очереди с более...

user10439725 / 21 мая 2019
1 голос
1 ответ

Есть ли способ заменить нулевые значения в кадре данных искры следующей строкой, а не нулевым...

xyz_scala / 21 мая 2019
0 голосов
2 ответов

Дано Dataset[Array[String]]. Фактически, эта структура имеет единственное поле типа массива. Есть...

satorg / 21 мая 2019
1 голос
1 ответ

все!Я кодирую искровой проект, смешивающий языки Scala и Java.Некоторые классы были написаны на...

Fernando de Sá / 21 мая 2019
0 голосов
2 ответов

Запуск пользовательской версии spark on пряжа в HDP работает нормально, следуя инструкциям из...

Georg Heiler / 21 мая 2019
0 голосов
1 ответ

Я устанавливаю spark и pyspark на свой сервер Ubuntu.Я пытаюсь установить свой путь SPARK_HOME на...

user3476463 / 21 мая 2019
0 голосов
0 ответов

Я строю линейную модель Pyspark, используя LinearRegression от pyspark.ml.regression from pyspark

ALEX MATHEW / 21 мая 2019
2 голосов
2 ответов

У меня есть задание структурированного потокового вещания Spark, которое молча умерло без явных...

Kevin Li / 21 мая 2019
0 голосов
1 ответ

У меня есть RDD, в котором мой ключ является идентификатором, а значения включают список...

datasure / 21 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...