Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
1 ответ

Я новичок в Python.Я также новичок в pysaprk.Я пытаюсь запустить строку кода, которая принимает (kv...

user3446905 / 18 мая 2018
0 голосов
2 ответов
0 голосов
1 ответ

Я использую Scala и Spark для анализа некоторых данных.Извините, я новичок в этой области. У меня...

Vlad / 16 мая 2018
0 голосов
1 ответ

У меня есть фрейм данных Spark (df1), подобный этому: deviceid host count a.b.c.d 0.0.0.0 1 a.b.c.d...

L Z / 16 мая 2018
0 голосов
0 ответов

Я хочу преобразовать фрейм данных в массив Json, используя Java и Spark версии 1.6, для которых я...

Irthiza Khan / 15 мая 2018
0 голосов
1 ответ

Я получаю экземпляр JavaRDD<Row> (ROW из здесь ), который я хочу преобразовать в...

Mahesha999 / 15 мая 2018
0 голосов
2 ответов

У меня есть искровой фрейм данных, с помощью которого я вычисляю евклидово расстояние между строкой...

Clock Slave / 15 мая 2018
0 голосов
1 ответ

Можно иметь массив разделов Spark DataFrame следующим образом: > df.rdd.partitions Есть ли...

user152468 / 15 мая 2018
0 голосов
2 ответов

В RDD в pyspark значение «realted_values ​​»является ключом к результатам логистической регрессии....

kingledion / 14 мая 2018
0 голосов
1 ответ

у меня есть файл names.txt пример данных: привет, привет, эй меня зовут Джек давайте сделаем это и...

Abdalla Issa Mbaideen / 14 мая 2018
0 голосов
0 ответов

Я создаю СДП с меткой, сопоставляя label и feature-set. Теперь я хочу распечатать данные в формате...

Ani Menon / 14 мая 2018
0 голосов
1 ответ

Входные данные: key,date,value 10,20180701,a10 11,20180702,a11 12,20180702,a12 13,20180702,a13 14...

sairam chowdary / 12 мая 2018
0 голосов
1 ответ

У меня есть раздел RDD в кластере, и я хочу сделать reduceByKey для каждого раздела отдельно.Я не...

Hoori M. / 11 мая 2018
0 голосов
1 ответ

У меня есть 3 CSV-файла, как показано ниже, я пытаюсь создать RDD и объединить RDD в окончательный...

dcu / 10 мая 2018
0 голосов
1 ответ

Я пытаюсь использовать приведенный ниже код в Scala, используя GraphX ​​ val vertexRDD:...

Litchy / 08 мая 2018
0 голосов
2 ответов

У меня есть код ниже val c: RDD[(String, String)] = graph.triplets.map( triplet => { if (triplet

Litchy / 08 мая 2018
0 голосов
0 ответов

Он, ребята. Я получаю сообщение об ошибке, когда я делаю что-то вроде этого: RDD = [(0, [1,2,3], 2)...

Pablo Luiz Leon / 08 мая 2018
0 голосов
1 ответ

Я сейчас пытаюсь построить RDD[Edge[String]] из RDD[(Long,Long,String)] Я видел код src Edge, у...

Litchy / 07 мая 2018
0 голосов
0 ответов

У меня есть PySpark DataFrame. Я хочу выполнить некоторую функцию forearchPartition и затем...

Stergios / 07 мая 2018
0 голосов
1 ответ

Я пытаюсь сделать простой поиск и агрегацию (больших) CSV из грамм Google. Для этого у меня есть...

Arnaud / 07 мая 2018
0 голосов
0 ответов

Я сейчас делаю некоторые операции с использованием GraphX ​​и хочу что-то вроде этого val ans =...

Litchy / 07 мая 2018
0 голосов
0 ответов

я хочу удалить данные из hbase с помощью rdd, вот мои коды def delGraphIdVertexInfo(vertexInfoRDD:...

user7687835 / 07 мая 2018
0 голосов
1 ответ

Я только начал изучать программирование на Spark и Python: не могли бы вы помочь мне понять мою...

Vinod / 06 мая 2018
0 голосов
1 ответ

У меня есть rdd следующего вида: rdd = sc.parallelize([(2, [199.99, 250.0, 129.99]), (4, [49.98,...

juamd / 06 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...