Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
0 ответов

Я новичок в Spark.Я пытаюсь выполнить некоторую операцию над набором геометрических многоугольников...

c00der / 06 мая 2019
0 голосов
1 ответ

Я пытаюсь прочитать файл, используя spark.sparkContext.textFile. Файл в кодировке Юникод. когда я...

senthilnathan / 06 мая 2019
0 голосов
0 ответов

Я создал RDD, который содержит растр DGM для определенной области и имеет crs : EPSG 32632. Я хочу...

rehan / 06 мая 2019
0 голосов
2 ответов

У меня есть массив значений, как показано ниже: scala> number.take(5) res1: Array[Any] =...

natg / 06 мая 2019
0 голосов
1 ответ

Я пытаюсь извлечь значения из Фрейма данных Pyspark после того, как Pyspark действительно работает,...

Vaslo / 06 мая 2019
0 голосов
2 ответов

У меня есть входные данные в следующем формате, который я пытаюсь разделить и создать пару...

K C / 04 мая 2019
0 голосов
2 ответов

У меня есть RDD [String] с этой формой: VAR1,VAR2,VAR3,VAR4, ... a , b , c , d , ... e , f , g , h ...

maxime rosano / 02 мая 2019
0 голосов
1 ответ
1 голос
1 ответ

Я относительно новичок в Pyspark.У меня есть RDD, составленный из списка кортежей.Я хотел бы...

Gerrrald1 / 01 мая 2019
0 голосов
3 ответов

Я новичок в Scala и RDD. Я использую Scala на Spark 2.4. У меня есть RDD [String] с такими...

maxime rosano / 30 апреля 2019
0 голосов
1 ответ

Я запускаю pyspark в Windows и реализую алгоритм, который ранее был реализован в python Я...

Rahmat Ullah Orakzai / 30 апреля 2019
1 голос
0 ответов

Я пытаюсь записать некоторые данные в bigtable, используя SparkSession val spark = SparkSession

codebot / 29 апреля 2019
1 голос
0 ответов

Я новичок в pyspark и пытаюсь понять точное использование toDebugstring (). Не могли бы вы...

Karthikeyan Rasipalayam Durai / 28 апреля 2019
0 голосов
2 ответов

Вот фактический конвейер. Я загружаю текст в RDD. Я тогда убираю это. rdd1 = sc

Annabanana / 27 апреля 2019
0 голосов
0 ответов

Я читаю файлы из S3 в DataFrame, ограничивая записи до 100. Затем я добавляю около 10 столбцов в...

Vijayant / 26 апреля 2019
0 голосов
1 ответ

После группировки моего набора данных это выглядит следующим образом (AD_PRES,1) (AD_VP,2)...

Learn Hadoop / 25 апреля 2019
0 голосов
0 ответов

Я пытаюсь обучить модель word2vec, используя реализацию spark.Я следую учебному пособию по...

penatbater / 25 апреля 2019
0 голосов
1 ответ
0 голосов
0 ответов

Из того, что я вижу, rdd.toDF() вводит PythonRDD, что становится ExistingRDD в плане запроса. df1 =...

colinfang / 24 апреля 2019
2 голосов
3 ответов

>>> rdd = sc.parallelize(range(10), 2) >>> rdd.glom().collect() [[0, 1, 2, 3, 4],...

ccbycc123 / 23 апреля 2019
0 голосов
1 ответ

У меня есть транслируемый словарь Python, который содержит фильтры даты по пользователю....

DataTx / 22 апреля 2019
1 голос
1 ответ

Я пытаюсь отфильтровать большой RDD на основе широковещательной переменной. Я смог сделать...

DataTx / 22 апреля 2019
1 голос
1 ответ

У меня есть СДР, верхние 2 элемента которого указаны выше: dataset_json = sc

M_Idk392845 / 22 апреля 2019
0 голосов
0 ответов

Как напечатать значение на каждой итерации в PairRDD, чтобы увидеть, как оно работает? x = sc

Karthikeyan Rasipalayam Durai / 22 апреля 2019
0 голосов
1 ответ

Я знакомлюсь со Spark и Scala, и моя текущая задача - «сложить» эти два кадра данных:...

agugglez / 20 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...