Вопросы с тегом рдд - PullRequest

Вопросы с тегом рдд

0 голосов
1 ответ

У меня есть фрейм данных spark, в котором у меня есть несколько столбцов, таких как tin, year,...

Naresh_17 / 11 июня 2019
1 голос
0 ответов

Как создать схему, DataFrame и загрузить 2-3 строки образцов данных, которые вписываются в эту...

user2458922 / 10 июня 2019
0 голосов
1 ответ

У меня есть две переменные ниже: var rddPair1 : Array[(String, String)] = Array((0000003,杉山______...

Công Anh / 10 июня 2019
1 голос
0 ответов

У меня есть DataFrame с идентификаторами документов doc_id, идентификаторами строк для набора строк...

Clay / 08 июня 2019
2 голосов
0 ответов

Я новичок в Apache Spark и использую версию 2.4.3, предварительно созданную для Hadoop 2.7.Мне...

noiseimpera / 08 июня 2019
0 голосов
1 ответ

Предположим, я выполняю простой скрипт pyspark data_rdd.map(some_fun).toDF(), где data_rdd содержит...

Tony / 08 июня 2019
1 голос
1 ответ

Я пытаюсь понять, как работает сериализация в случае самостоятельно сконструированного класса case...

Martin Nigsch / 07 июня 2019
2 голосов
1 ответ

Я пытаюсь сравнить временные метки на карте, но Spark, похоже, использует другой часовой пояс или...

belgacea / 06 июня 2019
0 голосов
0 ответов

Сценарий : укажите dataset в виде текста в указанном месте автономного кластера.Прочитайте эти...

HitchHiker / 06 июня 2019
1 голос
0 ответов

В двух разных программах, которые используют разные типы записи в коллекцию MongoDB, в эту...

Jonathan Myers / 05 июня 2019
0 голосов
1 ответ

Я наткнулся на приведенный ниже пример: lines = sc.textFile("some_file.txt") //line_1...

emilly / 05 июня 2019
0 голосов
1 ответ

У меня есть список массивов, для которых мне нужно найти элемент с самой высокой частотой для...

stan.steve / 05 июня 2019
0 голосов
2 ответов

У меня есть два файла ниже: file1 0000003 杉山______ 26 F 0000005 崎村______ 50 F 0000007 梶川______ 42 F...

Công Anh / 05 июня 2019
0 голосов
0 ответов

Я работаю над проблемой MapReduce, в которой я хочу отфильтровать каждый вывод раздела Map. Я хочу...

Yash / 05 июня 2019
0 голосов
1 ответ

Я должен посчитать повторяющиеся значения в массиве val arr = Array(1,2,2,3,4,5,5,5) Например, как...

Ch_03 / 05 июня 2019
1 голос
2 ответов

у меня есть val: val key: RDD[String]= Seq("0000005","0000001"...

Công Anh / 04 июня 2019
3 голосов
2 ответов

У меня проблема с созданием гистограммы в Scala.Я использовал histogram на СДР. Например: val eg =...

xin / 03 июня 2019
0 голосов
3 ответов

Я недавно начал работать с API Spark Dataset и пробую несколько примеров. Ниже приведен один такой...

Sivaprasanna Sethuraman / 02 июня 2019
0 голосов
1 ответ

Я должен использовать foldByKey в Списке, чтобы найти максимальную цену каждого предмета. Я...

Ankit / 30 мая 2019
1 голос
1 ответ

У меня есть СДР со следующим количеством элементов в каждом разделе (общее количество разделов val...

mjbsgll / 30 мая 2019
1 голос
0 ответов

Ниже мой код для rdd: temp_var = temp_var.map(lambda x: (x[0], ((x[1][2]*x[1][3])+ x[1][0],x[1]...

Naveen Gabriel / 29 мая 2019
0 голосов
1 ответ

Я новичок в использовании Python, так что простите, если вопрос звучит просто. Если у меня есть...

Kriti Arora / 29 мая 2019
0 голосов
1 ответ

Версия Spark: Scala 2.12.8 (Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_211) В следующем коде...

user10149299 / 28 мая 2019
1 голос
1 ответ

У меня есть СДР следующим образом: [(((1, 2), 1.0), (2, 3)), (((1, 2), 1.0), (3, 4)), (((1, 2), 3

kriti arora / 28 мая 2019
1 голос
1 ответ

Я пытаюсь получить доступ к каждой строке определенного "числа" столбца Int, чтобы проследить...

Naresh_17 / 28 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...