Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
2 ответов

У меня есть этот код в pyspark / python: n -> число чисел нового списка n = 2 new tuple ( x, y, z )...

Pablo Luiz Leon / 05 мая 2018
0 голосов
2 ответов

У меня есть PySpark RDD . Я хочу исключить дубликаты только тогда, когда "столбец 1" и "столбец 2"...

Sami / 05 мая 2018
0 голосов
1 ответ

Я поместил текстовый файл с именем Linecount2.txt в hdfs и построил простой rdd для подсчета...

abdul rahim / 04 мая 2018
0 голосов
1 ответ

Я выполняю запрос диапазона в СДР точек (x, y) в pyspark. Я разделил пространство xy на сетку 16 *...

user302787 / 04 мая 2018
0 голосов
1 ответ

Мои данные выглядят так: id | duration | action1 | action2 | ......

ka_boom / 03 мая 2018
0 голосов
2 ответов

Я читал о узких и широких зависимостях СДР, разделенных на несколько частей. Мой вопрос: я не...

cph_sto / 03 мая 2018
0 голосов
0 ответов

Я хотел бы взять каждую строку моего кадра данных Spark и обработать данные через микросервис,...

SriK / 03 мая 2018
0 голосов
1 ответ

Я хотел бы преобразовать RDD, содержащий записи строк, как показано ниже, в фрейм данных Spark....

user3096482 / 02 мая 2018
0 голосов
0 ответов

Я работаю с PySpark, используя фабрику mixin двух классов Но каждый раз, когда функция карты...

Zafar Mahmood / 30 апреля 2018
0 голосов
1 ответ

У меня следующий код: - val result = session.execute("Select * from table where imei=...

jAi / 30 апреля 2018
0 голосов
1 ответ

У меня есть два RDD - один из файловой системы hdfs, а другой создан из строки, как показано ниже -...

udit / 30 апреля 2018
0 голосов
1 ответ

У меня есть информация о пользователях в СДР: (Id:10, Name:bla, Adress:50, ...) И у меня есть еще...

Jean Wisser / 29 апреля 2018
0 голосов
0 ответов

На самом деле я использую искру и кассандру для выполнения некоторых заданий. Я хотел бы...

Dimac / 29 апреля 2018
0 голосов
0 ответов

У меня есть RDD (называемый «данными»), где каждая строка представляет собой пару id / vector,...

user3490622 / 29 апреля 2018
0 голосов
1 ответ

Я новичок в RDD и графиках и вычисляю кратчайший путь в графике с помощью Pregel. Я хочу...

onra / 27 апреля 2018
0 голосов
2 ответов

Есть ли способ эффективно разделить пространственное СДР в GeoSpark? например: разделы со многими...

Spartan / 27 апреля 2018
0 голосов
2 ответов

То, что я пытаюсь сделать, - это «перепробовать» небольшой CSV-файл со столбцом значения веса в...

rednight / 27 апреля 2018
0 голосов
1 ответ

У меня есть особое требование для денормализации данных, как показано ниже: Исходный кадр данных:...

Hari Gopinath / 26 апреля 2018
0 голосов
1 ответ

Нужна помощь в сортировке по ключу после вывода groupByKey: val skuRDD2:RDD[(String...

Chandra / 25 апреля 2018
0 голосов
1 ответ

Как мне создать СДР из файла CSV, у которого нет заголовка, и как мне объединить 2 СДР в столбце....

Rashmi Jhawar / 25 апреля 2018
0 голосов
0 ответов

Я пытаюсь использовать функцию createSataframe для sparksession, и я продолжаю получать сообщение...

Mike Wang / 25 апреля 2018
0 голосов
0 ответов

Я пытаюсь изменить мой JavaRDD из String на JavaRDD из Row.На шаге я меняю строку на строку

Mike Wang / 25 апреля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...