Вопросы с тегом Apache-искра - PullRequest

Вопросы с тегом Apache-искра

0 голосов
1 ответ

Я пытаюсь сгруппироватьBy, а затем вычислить процентиль на фрейме данных pyspark.Я протестировал...

Marc S / 14 декабря 2018
0 голосов
1 ответ

Я совершенно сбит с толку терминологией объединения в PySpark.Я перечислю, как я понимаю два из...

Qubix / 14 декабря 2018
0 голосов
2 ответов

У меня есть список URL, например: www.google.com www.yahoo.fr www.stackoverflow.com Я хочу удалить...

samtou006 / 14 декабря 2018
0 голосов
1 ответ

У меня проблема с динамическим обновлением столбцов в кадре данных Spark. По сути, мне нужно...

Turner / 13 декабря 2018
0 голосов
0 ответов

У меня есть очень большой набор данных df, который я создал, объединив данные из множества csv. Я...

saadi / 13 декабря 2018
0 голосов
1 ответ

Я пытаюсь округлить часы, используя pyspark и udf. Функция работает правильно на python, но не...

LaSul / 13 декабря 2018
0 голосов
1 ответ

Я пытаюсь преобразовать дату UTC в дату с местным часовым поясом (используя страну) с помощью...

LaSul / 13 декабря 2018
0 голосов
1 ответ

Как можно вычислить количество уникальных элементов в каждом столбце кадра данных pyspark: import...

Konstantin / 13 декабря 2018
0 голосов
2 ответов

Я пытаюсь преобразовать RDD в DataFrame в Spark Streaming.Я слежу за процессом ниже. socket_stream...

LUZO / 13 декабря 2018
0 голосов
5 ответов

Я бы хотел найти все строки, в которых product_id имеет как минимум 3 отзыва (review_id). Так что...

user / 13 декабря 2018
0 голосов
1 ответ

Ниже приведен график GCViewer для некоторых исполнителей Apache Spark: Куча использованного старого...

shay__ / 13 декабря 2018
0 голосов
0 ответов
0 голосов
0 ответов

Независимо от того, что я делаю, я не могу обойти эту ошибку при запуске Apache spark.Я запускаю...

etl_devs / 13 декабря 2018
0 голосов
0 ответов

У меня есть требование записать большой фрейм данных Spark в SQL Server.Это пакетное задание,...

saketh / 13 декабря 2018
0 голосов
1 ответ

У меня есть данные о подписках на журналы и о том, когда они были созданы, а также столбец, который...

Ashley O / 13 декабря 2018
0 голосов
1 ответ

Я пытаюсь запустить искровое задание с настраиваемой искрой на EMR и пытаюсь использовать...

Suraj N / 12 декабря 2018
0 голосов
1 ответ

Я новичок в pyspark и пытаюсь подключить Spark к Apache Kafka.Я использую этот код ниже, чтобы...

Gautam Prabakaran / 12 декабря 2018
0 голосов
1 ответ

У меня есть следующий код для сохранения СДР на Кассандре: JavaRDD<UserByID> mapped = .........

Hasson / 12 декабря 2018
0 голосов
1 ответ

Я делаю пробное упражнение мл pyspark, где мне нужно сохранить модель и прочитать ее обратно.Я могу...

nilesh1212 / 12 декабря 2018
0 голосов
1 ответ

Я перехожу по ссылке ниже, чтобы создать простое искровое задание в Java. https://www

snehal yadav / 12 декабря 2018
0 голосов
1 ответ

У меня есть датафрейм, имеющий миллион записей.Это выглядит так - df.show()...

ashish14 / 12 декабря 2018
0 голосов
1 ответ

Скажем, у меня есть список подписок на журналы, например: subscription_id user_id created_at 12384...

DataScienceAmateur / 11 декабря 2018
0 голосов
0 ответов

У меня есть фрейм данных со схемой, подобной этой: |-- gs: array (nullable = true) | |-- element:...

con / 11 декабря 2018
0 голосов
0 ответов

Если мы создаем dataFrame из объектов Python, таких как [dict или list], даже если данные Python...

Sergii V. / 11 декабря 2018
0 голосов
0 ответов

Я пытаюсь интегрировать Spark с Kafka с Python.У меня есть тема под названием mawstopic, которая...

Maws / 11 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...