Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
2 ответов

Я хочу отсортировать значения Double в СДР и хочу, чтобы моя функция сортировки игнорировала...

abc123 / 15 ноября 2018
0 голосов
1 ответ

Я пытаюсь выполнить некоторые задачи анализа текста с помощью pySpark. Я новичок в Spark, и я...

Catalina Herrera / 15 ноября 2018
0 голосов
1 ответ

Я хочу выполнить регрессию дерева решений на наборе данных в CSV. Требуется, чтобы я делал это с...

Faure / 15 ноября 2018
0 голосов
1 ответ

СЦЕНАРИЙ Я пытаюсь написать программу Spark, которая эффективно выполняет левое внешнее соединение...

m2008m1033m / 15 ноября 2018
0 голосов
2 ответов
0 голосов
3 ответов

Допустим, у меня есть искровой фрейм данных, который включает в себя категориальные столбцы (школа,...

John Subas / 13 ноября 2018
0 голосов
3 ответов

У меня есть пример файла, который я пытаюсь выяснить для данного поля общее число другого поля и...

Karthik Ramachandran / 13 ноября 2018
0 голосов
1 ответ

У меня проблема с модулем Spark GraphX. У меня кластер из 5 узлов, с 23,5 ГБ памяти и 24 ядрами на...

Sedir Mohammed / 12 ноября 2018
0 голосов
0 ответов

Мне известна концепция метода PrecisionByThreshold, когда я использую SparkML для реализации...

Coding_Rabbit / 11 ноября 2018
0 голосов
0 ответов

У меня есть фрейм данных, и я преобразовал его в rdd, но когда я применил функцию split, я получил...

melik / 07 ноября 2018
0 голосов
1 ответ

Я новичок в Spark и пытаюсь понять разницу между двумя JavaRDD и JavaPairRDD, а также насколько...

Harinder / 05 ноября 2018
0 голосов
1 ответ

Я использую Zeppelin с Spark (Scala) val sparkLicTextFilePath = "/home/tt/Software/spark-2.3

Haha TTpro / 05 ноября 2018
0 голосов
1 ответ
0 голосов
2 ответов

Я создал набор данных искры [Row], а Row is Row (x: Vector). х здесь 1xp вектор. Возможно ли: 1)...

Xiang Liu / 05 ноября 2018
0 голосов
1 ответ

У меня есть данные: {CurrentDate:05.24.2008,Employeeid:90786532432,Division:TX_VG} {Division:NW_VG...

prakash / 04 ноября 2018
0 голосов
0 ответов

У меня есть pyspark Dataframe, который я создал с помощью метода rdd reduceByKey (поэтому есть...

Nevermore / 02 ноября 2018
0 голосов
1 ответ
0 голосов
0 ответов

У меня есть фрейм данных с 20 столбцами и 25 записями (небольшие стандартные данные. Размер файла =...

Eyedia Tech / 02 ноября 2018
0 голосов
0 ответов

У меня есть набор дат Dataset<Row> table1, который я изменил, соединив его с другим набором...

RaulGupta / 01 ноября 2018
0 голосов
1 ответ

У меня есть файл на HDFS с конфигурациями ниже размера блока. Status: HEALTHY Total size:...

harshu katyal / 01 ноября 2018
0 голосов
0 ответов

Я хотел бы перераспределить данные с RDD[LabeledPoint] на K разделов и использовать раздел K для...

user1269298 / 01 ноября 2018
0 голосов
0 ответов

В моей домашней работе есть Генетический алгоритм и Spark Random Forest И я хочу вычислить точность...

C.Kent / 01 ноября 2018
0 голосов
2 ответов

Я хочу добавить уникальный номер строки в мой фрейм данных в pyspark и не хочу использовать методы...

vikrant rana / 31 октября 2018
0 голосов
1 ответ

Я новичок в Spark. И когда я использую функцию toDF () для преобразования RDD в dataframe, кажется,...

xking / 31 октября 2018
0 голосов
1 ответ

Я немного застрял, пытаясь конвертировать RDD[Array[Byte]] в Array[Byte]. У меня есть следующее,...

paranza / 31 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...