Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

В Spark с pyspark у меня есть фрейм данных с дубликатами.Я хочу дедуплицировать их с помощью...

adamcloud / 26 декабря 2018
0 голосов
2 ответов

У меня есть данные в следующем формате, которые получены из Hive в фрейм данных: date, stock, price...

Craig / 26 декабря 2018
0 голосов
0 ответов

Я создал RDD бизнес-объявлений по городским кодам, разделенным по французским департаментам, таким...

Marc / 26 декабря 2018
0 голосов
0 ответов

Я использую Apache Spark, используя Java на следующей конфигурации: 1) 100 миллионов входные строки...

A Learner / 26 декабря 2018
0 голосов
0 ответов

У меня есть несколько больших таблиц, сохраненных в s3 (для скорости), таких как ордера.Но...

Mithril / 26 декабря 2018
0 голосов
1 ответ

У меня есть данные в следующем формате, которые получены из Hive в фрейм данных: date, stock, price...

Craig / 26 декабря 2018
0 голосов
1 ответ

Моя виртуальная машина Java - в основном искровый исполнитель, который выполняет задачи одну за...

akshay / 25 декабря 2018
0 голосов
0 ответов

PySpark 2.4.0 Как обучить модель, которая имеет несколько целевых столбцов? Вот пример набора...

kosi / 25 декабря 2018
0 голосов
1 ответ

Я работаю над Apache Spark над проектом Java Maven. У меня есть комментарии подобного рода на этом...

ultrasGala / 25 декабря 2018
0 голосов
0 ответов

Я ищу помощь после стольких поисков в Google и до сих пор не могу решить мою проблему. Я пытаюсь...

Ram S / 24 декабря 2018
0 голосов
0 ответов

PySpark - версия 2.4.0 Я пытаюсь уменьшить количество выходных слоев.К сожалению, не удалось...

kosi / 24 декабря 2018
0 голосов
0 ответов

Есть ли способ записать данные в Neo4J db, используя исконный API в Java.Похоже на GraphFrame (org

User_qwerty / 24 декабря 2018
0 голосов
1 ответ

Я использую код ниже для отображения некоторых данных в спарк.Мне нужно уникальное последовательное...

bibhu_bioit / 24 декабря 2018
0 голосов
1 ответ

Я сделал тест Кафки, и это сработало.но когда я запускаю программу в IDE, я получаю эту ошибку и не...

Shenshixiang / 24 декабря 2018
0 голосов
0 ответов

Я хочу перевести прочитанные данные из sql в формат DataFrame.Как я могу это сделать?...

tim software / 24 декабря 2018
0 голосов
1 ответ

Число разделов, созданных для программы подсчета слов ниже, равно 10, но, насколько я понимаю, если...

Naresh / 23 декабря 2018
0 голосов
1 ответ

У меня есть небольшой скрипт для фильтрации слов, которые содержат значение liste Когда я делаю:...

samtou006 / 21 декабря 2018
0 голосов
1 ответ

У меня есть структура таблицы улья, как показано ниже - create table sessionize_data ( ip string...

Prashant Rane / 21 декабря 2018
0 голосов
0 ответов

java.util.concurrent.TimeoutException: Futures timed out after [100000 milliseconds] at scala

Girish / 20 декабря 2018
0 голосов
2 ответов

У меня есть архитектура с 4 узлами и RDD с 4000 строками, и мне необходимо равномерно распределить...

Giulia / 20 декабря 2018
0 голосов
1 ответ

Я пытаюсь декоррелировать запрос, который выглядит так: select A.id, A.other_id A.data, A.data2,...

Purple / 20 декабря 2018
0 голосов
0 ответов

У меня есть таблица (join_df), которая выглядит следующим образом:...

Aman Gupta / 20 декабря 2018
0 голосов
0 ответов

Мы пытаемся создать установку, где у нас есть сервер, который передает задания разных пользователей...

upasana arora / 20 декабря 2018
0 голосов
1 ответ

Я хотел бы создать столбец на моем фрейме данных spark с операциями над двумя столбцами. Я хочу...

Diego Hernández / 20 декабря 2018
0 голосов
2 ответов

У меня следующая структура папок - libfolder - lib1.py - lib2.py - main.py main.py, звонки...

Golak Sarangi / 20 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...