Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
1 ответ
0 голосов
2 ответов

Мне нужно иметь возможность получить количество различных комбинаций в двух отдельных столбцах. В...

TinaK / 02 декабря 2019
0 голосов
1 ответ

Я работаю с RDD, у которого есть несколько строк, начинающихся с #. Я хочу удалить все эти строки,...

Kalyani Rane / 01 декабря 2019
0 голосов
1 ответ

Мне нужно иметь возможность получить наиболее распространенное значение столбца с помощью Pyspark....

TinaK / 01 декабря 2019
2 голосов
1 ответ

Я пытаюсь создать СДР, который содержит массив кортежей с именами стран в качестве первого элемента...

Nelson Huang / 30 ноября 2019
1 голос
1 ответ

Я попытался добавить столбец с номером строки, используя zipWithIndex, как показано ниже, в spark...

John Humanyun / 11 ноября 2019
0 голосов
1 ответ

У меня есть СДР, groupResultMap, и напишите код ниже. if (groupResultMap.isEmpty) Map[String,...

user2037661 / 11 ноября 2019
0 голосов
1 ответ

У меня есть формат файла, показанный ниже, 0, Alpha,-3.9, 4, 2001-02-01 08:00:00, 5, 20 0, Beta, -3

Mass17 / 11 ноября 2019
0 голосов
0 ответов

Я пытаюсь суммировать все оценки на основе studentId. Я использовал lowerByKey. Но это бросает...

alnkr / 10 ноября 2019
0 голосов
1 ответ

В настоящее время я занимаюсь исследованием выявления заболеваний сердца и хочу использовать искру...

Shaiharyaar ahmad / 10 ноября 2019
0 голосов
1 ответ

У меня есть следующий формат файла: 0, Alpha,-3.9, 4, 2001-02-01, 5, 20 0, Beta,-3.8, 3, 2002-02-01...

Mass17 / 10 ноября 2019
0 голосов
1 ответ

Я пытаюсь использовать PySpark, чтобы найти среднюю разницу между смежным списком кортежей....

mrsquid / 10 ноября 2019
1 голос
1 ответ

Я пытаюсь использовать только операции на основе rdd. У меня есть файл, похожий на этот: 0, Alpha...

Mass17 / 09 ноября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...