Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть датафрейм в Pyspark со столбцом даты под названием «report_date». Я хочу создать новый...

PineNuts0 / 05 июня 2018
0 голосов
0 ответов

Я пытаюсь перевести ниже sql в pyspark в два разных синтаксиса, но оба кода выдают разный вывод,...

Sham / 05 июня 2018
0 голосов
2 ответов

В поисках более функционального и вычислительно эффективного подхода в PySpark -> У меня есть...

Miguel A. Friginal / 05 июня 2018
0 голосов
0 ответов

Я знаю, что невозможно просто обновить таблицу MySQL с помощью Spark, но я пытался что-то избежать,...

Gaspar Avit Ferrero / 05 июня 2018
0 голосов
1 ответ

В озере данных паркета, разделенном на year и month, с spark.default.parallelism, равным, например,...

TMichel / 05 июня 2018
0 голосов
1 ответ

Я хочу разбить фрейм данных "df1" на 3 столбца.Этот фрейм данных имеет ровно 990 уникальных...

Tomcat / 05 июня 2018
0 голосов
1 ответ

Я пытаюсь выполнить сценарий спарк с помощью следующей команды. spark-submit --packages org.apache

Gagan / 05 июня 2018
0 голосов
2 ответов

У меня есть фрейм данных, как показано ниже в PySpark.Я хочу выбрать serial_num, devicetype,...

Question_bank / 05 июня 2018
0 голосов
1 ответ

У меня есть pyspark.mllib.linalg.SparseMatrix с 100k строк и 20M столбцов.Каков наилучший формат...

Ehsan Sadr / 05 июня 2018
0 голосов
1 ответ

У меня есть фрейм данных, как показано ниже в pyspark. +---+-------------+----+ | id| device| val|...

User12345 / 05 июня 2018
0 голосов
0 ответов

Я могу прочитать файл json в фрейм данных в Pyspark, используя spark = SparkSession.builder

Leonius / 05 июня 2018
0 голосов
1 ответ

У меня есть фрейм данных (testdf), и я хотел бы получить счетчик и отчетливый счетчик для столбца...

thecoder / 05 июня 2018
0 голосов
1 ответ

Я создал кластер Dataproc с 1 мастером и 10 узлами.Все они имеют одинаковую конфигурацию процессора...

Bin Lin / 04 июня 2018
0 голосов
0 ответов

У меня странная проблема, я думаю, что это может быть ошибка в spark и / или pandas, но я не уверен...

seth127 / 04 июня 2018
0 голосов
2 ответов

Я стремлюсь добавить новый столбец в Pandas DataFrame, но я сталкиваюсь со странной ошибкой....

Pierre-Antoine / 04 июня 2018
0 голосов
2 ответов

Скажем, у меня есть такой фрейм данных: ID Media 1 imgix.com/20830dk 2 imgix.com/202398pwe 3 imgix

Ashley O / 04 июня 2018
0 голосов
1 ответ

Ежедневно я вычисляю некоторые статистические данные и сохраняю их в файле (около 40 строк данных)

SecretAgent / 04 июня 2018
0 голосов
1 ответ

У меня есть столбец 'true_recoms' в искровом фрейме данных: -RECORD...

Jackson / 04 июня 2018
0 голосов
1 ответ

Я пытаюсь выяснить, как правильно добавить шаг зажигания в мой кластер aws-emr из командной строки...

cracka31 / 04 июня 2018
0 голосов
2 ответов

При выполнении кода для получения искрового фрейма данных из HDFS, а затем преобразовать его в...

SarahData / 04 июня 2018
0 голосов
1 ответ

Я использую pyspark для чтения потоковых данных из Kafka, а затем хочу передать эти данные в...

Vivek Singh / 04 июня 2018
0 голосов
1 ответ

Это дополнительный запрос к моему предыдущему одному : следуя этому предложению, я получил...

shanlodh / 04 июня 2018
0 голосов
1 ответ

У меня есть Pyspark DataFrame с двумя столбцами: sendtime и charge_state, если обвинение_state...

Mr. Young / 04 июня 2018
0 голосов
2 ответов

Допустим, у меня есть два кадра данных - df1 и df2 - оба с колонками foo и bar.Столбец foo - это...

ghukill / 03 июня 2018
0 голосов
1 ответ

Я работаю над созданием модели LDA. Вот что я сделал до сих пор - создал униграмму и преобразовал...

lpt / 03 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...