Вопросы с тегом РДД - PullRequest

Вопросы с тегом РДД

0 голосов
0 ответов

Я пытаюсь построить kd-деревья из точек в паре RDD с именем "RDDofPoints" с типом RDD [BoundingBox...

user3316676 / 11 февраля 2019
0 голосов
2 ответов

Я не могу преобразовать rdd в фрейм данных, используя пользовательскую схему.Ниже приведены...

Jitu Biswakarma / 08 февраля 2019
0 голосов
1 ответ

Я хочу выбрать столбец из CSV-файла, используя только функцию rdd, а не фрейм данных в искре.Я...

SHALIN PATEL / 08 февраля 2019
0 голосов
1 ответ

Я запускаю скрипт Pyspark, который выполняет операцию map на СДР.Результатом такого map является...

frb / 06 февраля 2019
0 голосов
1 ответ

В Spark устойчивые распределенные наборы данных (RDD) - это API-интерфейсы низкого уровня, а фреймы...

Ravi Gurnatham / 06 февраля 2019
0 голосов
2 ответов

Сначала у меня было salesList: List[Sale], и чтобы получить идентификатор последней продажи в...

samba / 04 февраля 2019
0 голосов
0 ответов

Я получаю события из темы Кафки и предварительно агрегирую их перед сохранением в Elastic Search

alina / 04 февраля 2019
0 голосов
0 ответов

Как настроить разделение при повторном разбиении в Spark.Я ищу эквивалентную реализацию методов...

user2458922 / 04 февраля 2019
0 голосов
1 ответ

Перед публикацией этого вопроса я искал сообщество и ссылался на документы pyspark, но до сих пор...

SivaTP / 03 февраля 2019
0 голосов
1 ответ

Spark использует Map Reduce для внутреннего использования?(своя собственная карта уменьшения) Когда...

Enrique Benito Casado / 03 февраля 2019
0 голосов
2 ответов

Я столкнулся с проблемой при преобразовании столбца в моем фрейме данных в строковый формат.Пример...

user2122466 / 03 февраля 2019
0 голосов
0 ответов

Я пытаюсь запустить следующий код: lst = [25, 90, 81, 37, 776, 3320] testData = sc.parallelize(lst)...

Katheria / 03 февраля 2019
0 голосов
0 ответов

Если у меня есть коллекция RDD, которая имеет следующую форму: RDD[(ID, Iterable[(Var1,Var2)])]...

EliSquared / 02 февраля 2019
0 голосов
1 ответ

Если у меня есть следующая функция, и я хочу разделить Iterable на RDD Var1 с массивом Var2, каков...

EliSquared / 02 февраля 2019
0 голосов
0 ответов

Я новичок в программировании Spark, и мне нужно выполнить некоторые тесты для функций sampleByKey и...

Misha AM / 01 февраля 2019
0 голосов
0 ответов

Я пытаюсь проверить некоторые данные в новом файле hdfs при обработке текстового файла с помощью...

stack0114106 / 30 января 2019
0 голосов
0 ответов

Это большой текстовый файл данных обзоров Amazon, который мне нужно очистить и обобщить в RDD с...

Ankur Patel / 30 января 2019
0 голосов
1 ответ

У меня есть набор данных CSV со следующими столбцами (Accident_Id, Date, Area) и сотнями строк.Чего...

Oxford / 28 января 2019
0 голосов
1 ответ

У меня есть rdd, который я пытаюсь отфильтровать только для типа с плавающей точкой.Spark rdds...

swamoch / 26 января 2019
0 голосов
2 ответов

Я видел, как DAG генерировался всякий раз, когда мы выполняли какие-либо операции с RDD, но что...

Shubham Jain / 26 января 2019
0 голосов
1 ответ
0 голосов
0 ответов

У меня есть текстовый файл с тремя столбцами, разделенными табуляцией или пробелом в качестве...

Mikasa / 24 января 2019
0 голосов
1 ответ

В Scala Spark есть несколько методов, которые могут привести к разделению / перераспределению...

Gakuo / 23 января 2019
0 голосов
0 ответов
0 голосов
1 ответ

Я новичок в распределенной разработке Spark.Я пытаюсь оптимизировать существующее задание Spark,...

codeshark / 21 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...