Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
2 ответов

У меня есть следующий СДР, представляющий данные о продажах: val rddSales:RDD[((String, String),...

samba / 04 июля 2018
0 голосов
1 ответ

Кажется, одно из моих предположений было неверным в отношении порядка в СДР ( относящегося )....

icarus / 02 июля 2018
0 голосов
1 ответ

Я создал СДР ключа / значений следующим образом: RDD[(String, Int)]: rdd.map(row => row.split(1)...

Ranit Dholey / 01 июля 2018
0 голосов
0 ответов

Я не использую PySpark. Я использую Scala для запуска моего приложения Spark. Я выполняю скрипт...

JavaPlanet / 30 июня 2018
0 голосов
1 ответ

У меня есть искровой Dataframe с двумя столбцами «label» и «sparse Vector», полученные после...

jowwel93 / 29 июня 2018
0 голосов
0 ответов

Есть какие-нибудь короли искры? Вариант использования: у меня есть кадр данных в 1 миллион строк, я...

Sailesh Kotha / 29 июня 2018
0 голосов
2 ответов

У меня есть текстовый файл, содержащий десятки гигабайт данных, которые мне нужно загрузить из HDFS...

cppstudy / 28 июня 2018
0 голосов
1 ответ

Я смотрю на разделы СДР >>> rdd = sc.parallelize(range(10), 5) >>> rdd.collect()...

user2314737 / 28 июня 2018
0 голосов
1 ответ

У меня есть список искровых фреймов данных, и я должен выполнить с ними некоторую операцию Я хочу...

Gladiator / 27 июня 2018
0 голосов
2 ответов

Я пытался выполнить пример преобразования строки JSON в фрейм данных в искре, следуя официальной...

harshlal028 / 27 июня 2018
0 голосов
0 ответов

Я хочу объединить 2 записи на основе ключа, но не хочу пропустить и непарные записи. Например, у...

Anirudha Anikhindi / 26 июня 2018
0 голосов
2 ответов

Новый пользователь Spark здесь. Я извлекаю функции из многих изображений .tif, хранящихся на AWS S3...

bravery / 26 июня 2018
0 голосов
2 ответов

У меня есть столбец структуры в моем фрейме данных, и я хочу собрать его как список Scala. case...

mikeL / 26 июня 2018
0 голосов
1 ответ

У меня есть датафрейм, df.show () примерно так: +-----------+-------------------+ |id| name|...

Zhang Xin / 25 июня 2018
0 голосов
2 ответов

Как мы можем реализовать приведенную ниже логику в искре? Если значение столбца равно нулю, оно...

Ram / 24 июня 2018
0 голосов
1 ответ

Я делаю простое назначение в Apache Spark, используя Python.Допустим, у меня есть СДР:...

Axel V. / 23 июня 2018
0 голосов
2 ответов

Как я могу преобразовать СДР tuple2 (Ключ, Значение) с дубликатами Ключей в Карту [K, Список [V]]?...

Guillermo Teixeira / 13 июня 2018
0 голосов
1 ответ

У меня есть файл CSV, который хранится в формате hdf в следующем формате: Business Line,Requisition...

G.Marwah / 12 июня 2018
0 голосов
0 ответов

У меня проблема при преобразовании DataFrame в RDD.Кадр данных изначально создается из файла CSV:...

ed2412 / 12 июня 2018
0 голосов
1 ответ

Я пытаюсь получить большинство просматриваемых фильмов из набора рейтинговых данных и сопоставить...

sasi / 11 июня 2018
0 голосов
1 ответ

Я изучаю Spark и его параллелизм, связанный с распределением разделов RDD.У меня машина с 4...

rupert160 / 11 июня 2018
0 голосов
3 ответов

Я использую Apache Spark 2.11 и использую Scala.Есть ли способ соединить два RDD с помощью функции...

user2654096 / 09 июня 2018
0 голосов
1 ответ

Я хотел бы напечатать rdd-данные, используя scala, например: res1.foreach{case(userid...

刘米兰 / 08 июня 2018
0 голосов
1 ответ

Я хотел бы напечатать данные структуры scala, вот так res0.take(2).foreach{case (id,tags) =>...

刘米兰 / 08 июня 2018
0 голосов
1 ответ

данные rdd - это ключ, формат значения, а значение - это данные структуры. Как я могу распечатать...

刘米兰 / 07 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...