Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
0 ответов

Я использую spark и scala, выбираю данные из таблицы с именем persons из улья, в таблице есть...

hometown / 12 сентября 2018
0 голосов
2 ответов

У меня есть несколько RDD с одним общим полем CustomerId. Например: debitcardRdd имеет данные как...

Abhinay / 11 сентября 2018
0 голосов
1 ответ

Что-то в строках: rdd.map (x => x x) против rdd.mapPartions (x => x.map (c => c c)) будет ли...

Duckling / 10 сентября 2018
0 голосов
2 ответов

Этот вопрос касается groupByKey () в spark с использованием scala. Рассмотрим ниже данные Name...

Umar / 08 сентября 2018
0 голосов
0 ответов

Я пытаюсь запустить FPGrowth, но на самом деле я наткнулся на проблему с типами ввода. Учитывая...

Marco P. / 07 сентября 2018
0 голосов
1 ответ

Я разработал приложение Spark 2.2 для совместной фильтрации. Он прекрасно работает в IntelliJ для...

tom10271 / 07 сентября 2018
0 голосов
2 ответов

У меня есть пара СДР, например: id value id1 set(1232, 3,1,93,35) id2 set(321,42,5,13) id3 set(1233...

noobtoPro / 06 сентября 2018
0 голосов
1 ответ

Когда я пытаюсь распечатать содержимое RDD с помощью действия first(), я могу напечатать его с...

Erkan Şirin / 06 сентября 2018
0 голосов
1 ответ

У меня есть вопрос о разделении Spark DataFrame, в настоящее время я использую Spark 1.6 для...

Giorgio / 05 сентября 2018
0 голосов
1 ответ

У меня есть настройки строк в JavaPairRDD<String, MyPojo>, где MyPojo - это pojo с атрибутом...

christo16 / 04 сентября 2018
0 голосов
0 ответов

Я боролся за объединение DStream и RDD. Чтобы установить сцену: Искра - 2.3.1 Python - 3.6.3 РДД Я...

DataWookie / 03 сентября 2018
0 голосов
2 ответов

Недавно я начал использовать Apache Spark для сортировки большого количества данных. В моих...

Bruno / 02 сентября 2018
0 голосов
1 ответ

Я сомневаюсь, что Apache Spark использует Java-кодирование. я имею образец файла в виде простого...

Hernan Z / 02 сентября 2018
0 голосов
1 ответ

Я пытаюсь создать разные RDD на основе входного файла с разными типами записей, определенными в...

Rafael / 01 сентября 2018
0 голосов
0 ответов

Вот мой код: ssc =streamingcontext(sparkcontext,Seconds(time)) spark = sparksession.builder

Chethan / 01 сентября 2018
0 голосов
1 ответ

Я не могу найти сумму СДР. Я новичок в этой области, пожалуйста, помогите. Использование Python 2.7...

Aryan Soni / 30 августа 2018
0 голосов
0 ответов

У меня есть два набора данных с одинаковым количеством разделов; скажем 2 (на самом деле это...

zetaprime / 30 августа 2018
0 голосов
1 ответ

Я настроил новую систему, spark 2.3.0, python 3.6.0, чтение данных и другие операции, работающие...

Aakash Basu / 29 августа 2018
0 голосов
1 ответ

Мне нужно обработать фрейм данных, содержащий логи (вход и выход) для приложения Данные приведены...

Purmanund Sookun / 29 августа 2018
0 голосов
1 ответ

У меня есть несколько RDD, каждый из которых состоит из списка пользователей. Как я могу получить...

sleepy whiskey / 27 августа 2018
0 голосов
1 ответ

У меня есть текстовый файл в HDFS, который содержит около 10 миллионов записей. Я пытаюсь прочитать...

Sudharnath / 25 августа 2018
0 голосов
1 ответ

Я получаю TypeError, когда пытаюсь преобразовать СДР объекта Price в Pair RDD. Пример кода:...

Shankar / 25 августа 2018
0 голосов
0 ответов

У меня есть проект, в котором мне нужно выполнить скрипт Python на удаленной машине. Вкратце, я...

JavaPlanet / 24 августа 2018
0 голосов
1 ответ

Предположим, у меня есть RDD целых чисел, который выглядит следующим образом: (1,2,3,4,5,6,7,8) (т....

hawkeye / 05 июля 2018
0 голосов
1 ответ

Я новичок в Spark и Scala и хотел знать, могу ли я использовать тот же sparkContext, который я...

red27bull / 05 июля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...