Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
1 ответ

Это может быть глупый вопрос, но я не могу понять, как файлы распределяются по разделам.Мое...

Shashank V C / 24 февраля 2019
0 голосов
1 ответ

Я работаю с программой искры, которой необходимо постоянно обновлять некоторые СДР в цикле: var...

Skateboard / 24 февраля 2019
0 голосов
0 ответов

У меня есть следующий RDD, который мне нужен для выполнения операции деления между двумя целыми...

Matthew Loh / 23 февраля 2019
0 голосов
1 ответ

У меня есть rdd, содержащий значения ниже. rdd_2 = sc.parallelize([('f3.txt',...

Matthew Loh / 23 февраля 2019
0 голосов
1 ответ

У меня есть Rdd "labResults" объектов: case class LabResult(patientID: String, date: Long, labName:...

Ekaterina Tcareva / 22 февраля 2019
0 голосов
1 ответ

В моем искровом коде есть RDD[Person], и я хочу преобразовать этот rdd в dataframe.Класс Person не...

lucy / 20 февраля 2019
0 голосов
1 ответ

У меня есть СДР в форме (name,[token1, token2, ...]) с ключом name и значениями token.Например:...

Notna / 20 февраля 2019
0 голосов
1 ответ

У меня есть СДР ниже: Array( (0, "xx"), (1, "xx"), (2, "xx"), (1,...

ericxluo / 20 февраля 2019
0 голосов
0 ответов

Я не могу понять, как spark определяет количество разделов при чтении из AWS S3 Мой случай: Я...

Vaibhav Bacchav / 19 февраля 2019
0 голосов
1 ответ

Я хочу отобразить количество элементов в каждом разделе, поэтому я пишу следующее: def...

bib / 19 февраля 2019
0 голосов
2 ответов

В настоящее время я пытаюсь упаковать свой проект с использованием maven, однако тесты maven не...

Harelz / 18 февраля 2019
0 голосов
0 ответов

Мне нужно провести модульное тестирование одного метода, вход которого - DStream[String].Поэтому я...

Ignacio Alorre / 18 февраля 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я пытаюсь найти связанные компоненты в графе через Pyspark.Во-первых, я определил свой собственный...

Miguel Jiahao Wang / 17 февраля 2019
0 голосов
0 ответов

У нас есть набор данных из https://archive.ics.uci.edu/ml/datasets/Plants формат этих данных - файл...

Mohammed Shihab / 14 февраля 2019
0 голосов
0 ответов

Возьмите предложение: «Это искра апача».Я хочу иметь возможность преобразовывать каждое слово в...

user415612 / 14 февраля 2019
0 голосов
2 ответов

Я хочу преобразовать значения "myRDD" для пары RDD из Iterable [(Double, Double)] в Seq (Seq...

user3316676 / 14 февраля 2019
0 голосов
1 ответ

У меня есть JavaPairRDD, на котором я хочу выполнить итерацию, выполнить некоторую операцию и...

Sam / 14 февраля 2019
0 голосов
1 ответ

У меня есть сценарий использования, в котором я собираюсь группировать по ключу (ключам) при...

sashas / 13 февраля 2019
0 голосов
0 ответов

Мне нужно сгруппировать мой rdd по двум столбцам и объединить счет.У меня есть функция: def...

Ekaterina Tcareva / 12 февраля 2019
0 голосов
0 ответов

Я использую Neo4j для хранения данных графика и знаю, что хочу использовать Spark в качестве...

HashRocketSyntax / 12 февраля 2019
0 голосов
0 ответов

Я новая искра, я хочу получить смежность и получить СДР, но я не знаю, как это сделать...

Vision Yang / 12 февраля 2019
0 голосов
2 ответов

У меня есть фрейм данных Scala Spark (переменная df): id, values "a", [0.5, 0.6]...

Ivan / 12 февраля 2019
0 голосов
1 ответ

У меня проблема с матрицами в Spark. Предположим, у меня есть RowMatrix с именем X, например: 0.5 0

rifqi mulyadi / 11 февраля 2019
0 голосов
1 ответ

У меня есть m2 СДР, состоящий из case class Medication(patientID: String, date: Date, medicine:...

Ekaterina Tcareva / 11 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...