Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
0 ответов

Я запускаю простой проект Spark в кластере EMR YARN, чтобы: прочитать текстовый файл на S3 в...

Kevin Lawrence / 27 мая 2019
0 голосов
2 ответов

У меня есть данные с ненужными пробелами и значениями Null в моем CSV-файле.Я загрузил этот файл в...

Siva / 26 мая 2019
0 голосов
1 ответ

Я пытаюсь следовать этому примеру, чтобы разбить строки hbase: https://www.opencore

Stanislav Palatnik / 26 мая 2019
0 голосов
1 ответ

Я пытаюсь преобразовать список карт (Seq [Map [String, Map [String, String]]) в таблицу / кортеж...

Stanislav Palatnik / 24 мая 2019
2 голосов
1 ответ

У меня есть RDD с другим набором значений, и я хочу вернуть все отдельные наборы из исходного RDD....

Abhishek Dhanasetty / 23 мая 2019
0 голосов
0 ответов

Мне нужно передать ко многим различным сценариям и денормализовать все результаты в одну таблицу (,...

ecoe / 22 мая 2019
1 голос
0 ответов

Я хотел использовать foreachPartition на фрейме данных, чтобы отправлять данные каждой строки...

Harsh Gaur / 22 мая 2019
0 голосов
2 ответов

У меня есть датафрейм, который выглядит следующим образом: items_df...

Sriram Ranganathan / 22 мая 2019
0 голосов
1 ответ

Я пытался добавить значения существующего списка в кортеж.Это не показывает ошибку компилятора, но...

0 голосов
1 ответ

У меня есть RDD, в котором мой ключ является идентификатором, а значения включают список...

datasure / 21 мая 2019
3 голосов
1 ответ

У меня есть rdd с парой ключ-значение в Scala. Я хочу сформировать rdd таким образом, чтобы оно...

datasure / 20 мая 2019
1 голос
1 ответ

Я создаю rdd с wholeTextfiles.Я получаю filepath и filetext.Я хочу новый RDD с filepath и индексом...

datasure / 18 мая 2019
0 голосов
0 ответов

У меня есть СДР, как показано ниже, и я хотел бы получить доступ к элементам в каждой строке по их...

user2235010 / 16 мая 2019
1 голос
1 ответ

Я вычисляю косинусное сходство между всеми строками фрейма данных с помощью следующего кода: from...

confused_pandas / 14 мая 2019
1 голос
1 ответ

У меня есть данные textFile, которые выглядят как 28.225.37.170 - - [14/May/2019:00:00:05 +0000]...

moez skanjii / 14 мая 2019
1 голос
1 ответ

У меня есть этот rdd, содержащий кортежи, и сбор их даст мне список. [x1, x2, x3, x4, x5] Но я хочу...

kiran gali / 14 мая 2019
0 голосов
1 ответ

Я хотел бы разделить мой RDD относительно запятых и получить доступ к предопределенному набору...

maxime rosano / 14 мая 2019
0 голосов
2 ответов

Когда я пытаюсь создать фрейм данных со схемой в приведенном ниже коде, он не работает, и если это...

Sainath / 14 мая 2019
1 голос
0 ответов

У меня есть задание spark (spark 2.1), которое обрабатывает потоковые данные, используя прямой...

Liz / 14 мая 2019
0 голосов
1 ответ

Этот вопрос является почти точной копией требования здесь: Запись файлов в локальную систему с...

knowone / 14 мая 2019
0 голосов
1 ответ

Я пытаюсь прочитать CSV-файл в JavaRDD. Для этого я написал код ниже: SparkConf conf = new...

JollyRoger / 10 мая 2019
0 голосов
0 ответов

Я использовал потоковую обработку Spark 2.1 для обработки данных о событиях от Kafka. После...

Liz / 10 мая 2019
11 голосов
1 ответ

Я пытаюсь отфильтровать данные в соответствии с полем даты и времени. Образец из моих данных: 303,0

JollyRoger / 08 мая 2019
0 голосов
0 ответов

Я пытаюсь выбрать некоторые столбцы из RDD, в котором есть данные, считанные из файла CSV. Однако...

taimuri / 08 мая 2019
0 голосов
1 ответ

Я новичок в spark и имею данные ниже в формате csv, которые я хочу преобразовать в правильный...

Sahil / 07 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...