Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть датафрейм, который является продуктом левого соединения. Теперь я хочу создать...

Shane / 22 мая 2019
0 голосов
3 ответов

У меня есть искровой DataFrame, состоящий из 3 столбцов: text1, text2 и number. Я хочу...

moudi / 22 мая 2019
0 голосов
2 ответов

У меня есть кластер на EMR (emr-5.20.0) с m5.2xlarge в качестве Node Master, два m4.large в...

Carlos Henrique / 22 мая 2019
0 голосов
1 ответ

У меня есть фрейм данных в Pyspark, на котором я хочу сосчитать нули в столбцах и различные...

Manas Jani / 22 мая 2019
3 голосов
2 ответов

В pyspark у меня есть такой фрейм данных, как показано ниже, в котором строки сортируются по...

user3192082 / 22 мая 2019
1 голос
2 ответов

У меня есть этот фрейм данных: from pyspark.mllib.linalg.distributed import IndexedRow rows = sc

Maria Nazari / 22 мая 2019
1 голос
1 ответ

У меня есть столбец в pyspark.sql.DataFrame типа matrix. Каждая ячейка в этом столбце имеет...

pSash / 22 мая 2019
0 голосов
0 ответов

Я использую pandas_udf, чтобы применить модель машинного обучения к моему искровому кластеру, и...

Jlanday / 22 мая 2019
0 голосов
0 ответов

Я пытаюсь представить скрипт Python на Spark, который должен использовать pos_tag, но всякий раз,...

Harshdeep Singh / 21 мая 2019
0 голосов
0 ответов

У меня есть некоторые данные, которые я пытаюсь сохранить в файл паркета с помощью PySpark, а затем...

user3711502 / 21 мая 2019
0 голосов
1 ответ

Я новичок в PySpark, и я пытаюсь понять, как мы можем написать несколько вложенных циклов for в...

Rahmat Ullah Orakzai / 21 мая 2019
0 голосов
1 ответ

У меня есть кадр данных, как показано ниже, теперь мне нужно транспонировать вывод данных в виде...

Joby / 21 мая 2019
0 голосов
0 ответов

У меня есть приложение, которое загружает файлы CSV (в кодировке UTF-8, также называемые кодировкой...

user3711502 / 21 мая 2019
0 голосов
1 ответ

Я хочу переписать ниже для цикла, записанного в R в Pyspark. for (i in unique(fix_map[!is

Tilo / 21 мая 2019
1 голос
2 ответов

Я написал код pyspark, выполняя следующую операцию, но он не работает должным образом. Кто-нибудь...

Tilo / 21 мая 2019
0 голосов
1 ответ

Я хочу создать столбец с именем "id", который будет иметь номера строк, которые будут...

Tilo / 21 мая 2019
0 голосов
0 ответов

Я пытаюсь найти функцию или UFD для использования, который эквивалентен Ora_hash в Oracle.Цель...

Gluew / 21 мая 2019
0 голосов
0 ответов

Я пытаюсь сгенерировать файл из Dataframe, который я создал в AWS-Glue, я пытаюсь дать ему...

Rakesh Guha / 21 мая 2019
1 голос
0 ответов

Я запускаю некоторый код pyspark локально на концентраторе jupyter.Оперативная память моей системы...

Tilo / 21 мая 2019
0 голосов
1 ответ

Мы читаем данные из динамо-базы данных, поэтому получаем тип данных в виде строки, но мы хотим...

Ahito / 21 мая 2019
0 голосов
0 ответов

контекст улья создан из sc. from pyspark import HiveContext hc = HiveContext(sc) затем прочитайте...

hangkongwang / 21 мая 2019
0 голосов
0 ответов

Я хотел бы сделать вложенную перекрестную проверку в Spark.Я не могу найти способ выполнить...

Odisseo / 21 мая 2019
0 голосов
0 ответов

Мне нужно прочитать некоторые csv-файлы с использованием искрового фрейма данных и обработать эти...

Balakrishnan / 21 мая 2019
0 голосов
1 ответ

У меня есть два кадра данных dd1 и dd2, и я хочу присоединиться к этим кадрам данных. dd1: id name...

vishwajeet / 21 мая 2019
0 голосов
1 ответ

Я устанавливаю spark и pyspark на свой сервер Ubuntu.Я пытаюсь установить свой путь SPARK_HOME на...

user3476463 / 21 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...