Вопросы с тегом РДД - PullRequest

Вопросы с тегом РДД

0 голосов
1 ответ

Я пытаюсь добавить столбец индекса в набор данных, используя приведенный ниже код, который...

xout / 18 декабря 2018
0 голосов
0 ответов

При попытке преобразовать Spark RDD в фрейм данных возникла следующая ошибка при запуске задания...

TheShark / 17 декабря 2018
0 голосов
2 ответов

Я использую Spark для обработки CSV-файлов.Недавно я заменил ручной разбор CSV-строк на opencsv.Вот...

Wojciech Wirzbicki / 17 декабря 2018
0 голосов
1 ответ

Я пробовал метод "sortBy", например так: ranks.sortBy(x=> x._2, false); Однако значение рангов...

leroy / 17 декабря 2018
0 голосов
2 ответов

Я пытаюсь достичь следующего фрейма данных: ------------------------- | FOO | BAR | BAZ | | lorem |...

Bertrand / 17 декабря 2018
0 голосов
1 ответ

Я создал последовательность данных снизу. val df = sc.parallelize(Seq((100,23,9.50), (100,23,9.51),...

Nagaraj Vittal / 17 декабря 2018
0 голосов
1 ответ

У меня есть следующие значения: case class Rating(user_ID: Integer, movie_ID: Integer, rating:...

S. N / 16 декабря 2018
0 голосов
1 ответ

У меня есть следующий код для сохранения СДР на Кассандре: JavaRDD<UserByID> mapped = .........

Hasson / 12 декабря 2018
0 голосов
2 ответов

У меня есть СДР с двумя элементами (идентификатор, дата).Со следующей структурой: data=sc

Pedro Alves / 12 декабря 2018
0 голосов
0 ответов

Я знаю, что block - это базовая единица хранения, а partition - базовая единица вычислений в Spark....

chenzhongpu / 12 декабря 2018
0 голосов
1 ответ

Возможно преобразовать элемент RDD в datetime без преобразования RDD в DataFrame? Я пробую много...

Pedro Alves / 10 декабря 2018
0 голосов
0 ответов

У меня есть RDD (данные) со следующими элементами: first_name, last_name, technology...

Pedro Alves / 08 декабря 2018
0 голосов
1 ответ

У меня возникла проблема при преобразовании файла .csv в многострочный файл json с помощью pyspark....

khadar / 08 декабря 2018
0 голосов
1 ответ

У меня есть этот СДР: [[u''], [u'E01', u'Lokesh'], [u'E10',...

Pedro Alves / 07 декабря 2018
0 голосов
1 ответ

Я новичок в освоении, я знаю SQL, но хотел бы знать различия между RDD (Resilient Distributed...

BWin / 07 декабря 2018
0 голосов
1 ответ

Я разрабатываю приложение Spark с помощью Scala.Мое приложение состоит только из одной операции,...

m2008m1033m / 06 декабря 2018
0 голосов
3 ответов

rdd1: (m1,p1) (m1,p2) (m1,p3) (m2,p1) (m2,p2) (m2,p3) (m2,p4) rdd2: (m1,p1) (m1,p2) (m1,p3) (m2,p1)...

prakash / 05 декабря 2018
0 голосов
1 ответ

У меня есть 2 RDD с одним и тем же ключом, но разными типами значений (более 2-х значений).Я хочу...

P-S / 05 декабря 2018
0 голосов
1 ответ

В pyspark, как преобразовать входной RDD с JSON в указанный ниже вывод при применении...

P-S / 05 декабря 2018
0 голосов
2 ответов

Я создал Rdd, как показано ниже rdd=sc.parallelize([['A','C','B'],...

Sai / 05 декабря 2018
0 голосов
1 ответ

У меня есть вопрос о том, как обновить значения JavaRDD. У меня есть...

user3657377 / 05 декабря 2018
0 голосов
1 ответ
0 голосов
1 ответ
0 голосов
0 ответов

У меня есть входные данные в формате RDD[ (Map1, RecordA), (Map2, RecordX), (Map1, RecordB), (Map2,...

abc123 / 03 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...