Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

Я использую pyspark и имею несколько списков, таких как: A = [5, 2, 3, 24, 1, ....] B =...

James Flanagin / 25 июня 2019
0 голосов
2 ответов

Мой ввод был kafka-потоком только с одним значением, разделенным запятыми. Похоже на это....

kxell2001 / 25 июня 2019
0 голосов
0 ответов

Я пытаюсь объединить таблицу с view2 (которая создается с помощью Multiple CTE'S) с помощью...

Goutham ssc / 25 июня 2019
2 голосов
1 ответ

Можно ли отправить объект Java в качестве значения в теме Kafka и как мне использовать его в spark?...

kxell2001 / 25 июня 2019
0 голосов
0 ответов

Мне нужно уменьшить количество измерений из моих данных.Я хочу использовать VIF для этого.Мои...

Kishan Vyas / 25 июня 2019
1 голос
1 ответ

Я ищу утилиту python, которая позволяет динамически создавать фиктивный файл в HDFS, не затрагивая...

Sidd / 24 июня 2019
1 голос
0 ответов

В последнее время я работаю над большим набором данных ключ-имя-значение.Я хочу сгруппировать по...

username_HI / 24 июня 2019
0 голосов
1 ответ

Я использую PySpark 2.3.1 для чтения потока значений из Kafka как DStream s. Я хочу выполнить...

Wassinger / 21 июня 2019
0 голосов
1 ответ

Я пытаюсь переименовать столбец (тип даты), но не уверен, был ли синтаксис неправильным или это...

David / 21 июня 2019
1 голос
2 ответов

У меня есть кластер DataProc с одним мастером и 4 работниками.У меня есть это искровое задание:...

Claudio M / 21 июня 2019
0 голосов
0 ответов

У меня довольно простая искровая работа, которая объединяет несколько наборов данных. Код примерно...

Carl Ambroselli / 21 июня 2019
0 голосов
1 ответ

Я пытаюсь прочитать kafka, используя spark, но, похоже, столкнулся с некоторой библиотечной...

abhishek_rathaur / 21 июня 2019
0 голосов
1 ответ

Я сталкиваюсь с проблемой, когда вижу следующее сообщение об ошибке - в основном около null: An...

userMod2 / 21 июня 2019
0 голосов
0 ответов

Я смотрю groupBy agg на приведенном ниже кадре данных Spark и получаю среднее, максимальное и...

Matt W. / 20 июня 2019
0 голосов
1 ответ

В PySpark у меня есть датафрейм, состоящий из двух столбцов: +-----------+----------------------+ |...

Matteo Guarnerio / 20 июня 2019
2 голосов
3 ответов

Приведенный ниже код успешно создает искровой контекст при отправке с использованием spark submit и...

Siddeshwar / 20 июня 2019
0 голосов
1 ответ

Я запрашиваю таблицу sql с помощью pyspark. Если у меня есть таблица sql, которая имеет два столбца...

Meet Patel / 20 июня 2019
0 голосов
1 ответ

Мне нужно создать программу подсчета букв в java spark, используя JavaRDD, как java Wordcount.Но я...

TechNoob / 19 июня 2019
0 голосов
0 ответов

Мы передаем несколько ZIP-файлов на Spark-Submit с параметрами --py-files, пример ниже....

Joby / 19 июня 2019
0 голосов
1 ответ

Я делаю приложение scala-spark, которое получает данные из MySQL.Если я бегу от затмения, это...

jalollo / 19 июня 2019
3 голосов
2 ответов

У меня есть следующие данные, где id - это целое число, а vectors - это массив: id, vectors 1, [1,2...

Ivan / 19 июня 2019
0 голосов
1 ответ

Мне нужно переименовать столбцы таблицы () со значениями из таблицы сопоставления (df2 ниже) в...

PeterThePig / 18 июня 2019
0 голосов
0 ответов

Я портирую на pyspark алгоритм прогнозирования, разработанный на python.Среди различных этапов...

ndricca / 18 июня 2019
0 голосов
0 ответов

У меня есть набор данных, который выглядит следующим образом: +-----+-----+ |prev |next |...

Krzysztof Atłasik / 18 июня 2019
0 голосов
1 ответ

Впервые в Spark и PySpark я пытаюсь добавить поле / столбец в DataFrame путем поиска информации в...

Leo Saguisag / 18 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...