Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
1 ответ

Я пытаюсь случайным образом выбрать фрейм данных Pyspark, где значение столбца соответствует...

codingenthusiast / 18 октября 2019
0 голосов
2 ответов

Я хочу умножить столбец (скажем, x3) фрейма данных PySpark (скажем, df) на скаляр (скажем, 0.1)....

Siddharth Satpathy / 18 октября 2019
0 голосов
0 ответов

Я пытаюсь использовать приблизительное число, отличное в pyspark, используя реализацию...

user2926523 / 18 октября 2019
0 голосов
0 ответов

Я хочу манипулировать моим транзакционным фреймом в зависимости от некоторых условий. Мой...

Pallavi Verma / 17 октября 2019
0 голосов
2 ответов

Я пытаюсь получить новое значение, которое приходит из значения столбца плюс имя другого столбца....

han / 16 октября 2019
0 голосов
0 ответов

Используя PySpark, я пытаюсь добавить новый столбец к существующему фрейму данных, где записи в...

Siddharth Satpathy / 16 октября 2019
0 голосов
1 ответ

Предположим, у меня есть следующая структура данных в фрейме данных pyspark: arr1:array...

Paul Velthuis / 15 октября 2019
0 голосов
2 ответов

У меня есть требование переместить строки в столбцы. Есть 2 таблицы (показано ниже). Каждая запись...

marie20 / 15 октября 2019
0 голосов
1 ответ

Мое требование - расположить записи в хронологическом порядке и сравнить каждую запись с ее...

marie20 / 15 октября 2019
0 голосов
0 ответов

Я пытался использовать искровой SQL для накопления суммы, и для этого я использовал оконную функцию

Zihao Zheng / 15 октября 2019
1 голос
2 ответов

У меня есть ниже, чтобы прочитать все файлы в каталоге, но я тоже пытаюсь получить подкаталоги. Я...

kikee1222 / 14 октября 2019
0 голосов
1 ответ
1 голос
1 ответ

Я новичок в pyspark. Я хочу применить StringIndexer, чтобы изменить значение столбца на индекс. Я...

kevin / 14 октября 2019
0 голосов
1 ответ

Я новичок в pyspark. Мне интересно, что означает rdd в фрейме данных pyspark. weatherData = spark

kevin / 13 октября 2019
1 голос
0 ответов

У меня есть фрейм данных Pyspark, который выглядит следующим образом >>> df1.show(1,False)...

Bala / 13 октября 2019
0 голосов
2 ответов
1 голос
0 ответов

> %pyspark from pyspark.ml.feature import Tokenizer from > pyspark.sql.functions import col,...

sydbristow / 13 октября 2019
0 голосов
0 ответов

Я новичок в pyspark. Я хочу найти номер строки «NA» для каждого столбца. Код ниже имеет проблему. Я...

kevin / 13 октября 2019
3 голосов
2 ответов

У меня есть фрейм данных PySpark (скажем, df), который имеет два столбца (Name и Score). Ниже...

Siddharth Satpathy / 11 октября 2019
2 голосов
0 ответов

При сохранении фрейма данных pyspark с новым столбцом, добавленным с помощью функции withColumn,...

Prasanna Saraswathi Krishnan / 10 октября 2019
0 голосов
1 ответ

Я хочу создать строку из списка подстрок и соответствующего списка частот. Например, мой df_in...

zyw92 / 10 октября 2019
2 голосов
1 ответ

У меня есть искровой фрейм данных с несколькими столбцами, и каждый столбец содержит строку....

gokaadnit sougangar / 10 октября 2019
0 голосов
0 ответов

У меня странная проблема в среде Databricks. Я пытаюсь выполнить некоторую отладку, но результаты...

juske / 10 октября 2019
0 голосов
1 ответ

Я использую pyspark (Spark 2.3.2) saveAsTable следующим образом: df.write

Martin Studer / 09 октября 2019
0 голосов
1 ответ

Я новичок в PySpark. Я создал искровой фрейм данных, и у меня есть столбец «Страны», который...

Oleg Zdanevich / 09 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...