Вопросы с тегом РДД - PullRequest

Вопросы с тегом РДД

0 голосов
3 ответов

Я новичок в pyspark, и пока немного сложно понять, как он работает, особенно когда вы используете...

Mehdi Mansouri / 21 января 2019
0 голосов
1 ответ

У меня есть два файла, и я создал из них два кадра данных prod1 и prod2. Мне нужно найти записи с...

SHAMPA PRAMANIK / 20 января 2019
0 голосов
1 ответ

У меня есть искровое приложение. Мой пример использования - позволить пользователям определять...

Ankit Khettry / 18 января 2019
0 голосов
1 ответ

Я изучал pyspark, когда столкнулся с этим. from pyspark.sql import Row df = spark

Shilpa / 18 января 2019
0 голосов
0 ответов

В функции evictBlocksToFreeSpace указано: Попробуйте выселить блоки, чтобы освободить определенное...

chenzhongpu / 17 января 2019
0 голосов
1 ответ

Например, если в драйвере Spark запущен следующий код: rdd.foreachPartition(iterator =>...

Aether / 17 января 2019
0 голосов
1 ответ

(K1, (v1, v2)) (K2, (v3, v4)) (K1, (v1, v5)) (K2, (v3, v6)) Как можно суммировать значения ключа,...

abraham foto / 17 января 2019
0 голосов
0 ответов

Мне нужно рассчитать размер СДР в Java. В Scala это было довольно легко, и я использовал следующий...

aran / 16 января 2019
0 голосов
1 ответ

У меня есть данный кусок кода. Я запускаю это на Spark 2.3.1, используя Zeppelin 0.8.0 и org.apache

ferdyh / 16 января 2019
0 голосов
0 ответов

У меня очень большая структура, которая создается во время выполнения задания, которая имеет...

ss5972 / 15 января 2019
0 голосов
1 ответ

Я пытаюсь построить BlockMatrix, +---+---+---+---+ |7.0|6.0|3.0|0.0| |3.0|2.0|5.0|1.0| |9.0|4.0|0

Luke / 13 января 2019
0 голосов
2 ответов

Я могу flatMap 2-й элемент СДР, хорошо. val rdd = sc.parallelize( Seq( (1, "Hello how are...

thebluephantom / 10 января 2019
0 голосов
1 ответ

У меня есть коллекция точек с координатами x и y в формате RDD [Double, Double]. Я хочу найти...

user3316676 / 10 января 2019
0 голосов
3 ответов

У меня есть набор координат (x, y) в качестве моих данных в CSV-файле. Я хочу передать эти x и y в...

theoutlaw / 07 января 2019
0 голосов
0 ответов

СДР содержит 2-мерные векторы, как в примере ниже. ---------- 8535,9232 --------- 9343,5123...

Alastor / 07 января 2019
0 голосов
1 ответ

Я пытаюсь отобразить значения из CSV-файла в RDD, но я получаю следующую ошибку, потому что...

Alastor / 06 января 2019
0 голосов
1 ответ

Я пытаюсь решить проблему, когда скажем, что человек занял деньги у кого-то, и тогда у нас есть вся...

Ashish Mishra / 06 января 2019
0 голосов
1 ответ

например: x = RandomRDDs.normalRDD(sc, size=3, seed=0) х выглядит так: [-1,3, -2,4, -4,5] Я хочу...

Yvonne / 05 января 2019
0 голосов
0 ответов

если у меня есть фрейм данных Spark, я могу при записи очень легко разбить данные на несколько...

SiLaf / 03 января 2019
0 голосов
1 ответ

У меня есть RDD в pyspark вида (ключ, другие вещи), где "другие вещи" - это список полей.Я хотел бы...

Panda / 01 января 2019
0 голосов
1 ответ

я получил 1 сообщение в кафке, состоящее из нескольких независимых строк json.я хочу передать это...

ulkas / 27 декабря 2018
0 голосов
1 ответ

У меня есть текстовый файл, который не разделен никаким символом, и я хочу разделить его на...

Akjpunia / 27 декабря 2018
0 голосов
1 ответ

Цель # Распечатать набор данных с названием фильма и числом раз, когда он был оценен. Это простой...

Slimpunkerz / 27 декабря 2018
0 голосов
2 ответов

У меня есть архитектура с 4 узлами и RDD с 4000 строками, и мне необходимо равномерно распределить...

Giulia / 20 декабря 2018
0 голосов
0 ответов

Я использовал функцию kdtree для построения kdtree из последовательности значений Double.Мой вывод...

user3316676 / 19 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...