Вопросы с тегом pyspark-sql - PullRequest

Вопросы с тегом pyspark-sql

0 голосов
1 ответ

Мне нужно проверить каждый столбец фрейма данных с ожидаемой длиной или нет.Если нет, необходимо...

Prabu K / 25 февраля 2019
0 голосов
2 ответов

У меня есть фрейм данных pyspark: ABC 1 NA 9 4 2 5 6 4 2 5 1 NA Я хочу удалить строки, содержащие...

jk1093 / 23 февраля 2019
0 голосов
1 ответ

У меня есть мой код T-SQL, как показано ниже cast( dateadd(minute, - 240,...

Ameya / 22 февраля 2019
0 голосов
2 ответов

У меня есть код T-SQL, ниже которого я конвертировал в Pyspark, но выдает ошибку CASE WHEN...

Katelyn Raphael / 22 февраля 2019
0 голосов
1 ответ

У меня есть искровой фрейм данных с 10 столбцами, которые я записываю в таблицу в формате hdf.У...

sectechguy / 21 февраля 2019
0 голосов
0 ответов

Менеджер транзакций не является ACID, поэтому я не могу использовать транзакцию ACID здесь.Я...

mouni peram / 21 февраля 2019
0 голосов
1 ответ

Ниже приведен код T-SQL.Я попытался преобразовать его в pyspark с помощью оконных функций, которые...

Katelyn Raphael / 21 февраля 2019
0 голосов
1 ответ

Я новичок в pyspark.У меня есть код панды, как показано ниже. bindt = df[df[var].notnull()][var]

Valli69 / 21 февраля 2019
0 голосов
1 ответ

Ниже приведен код T-SQL.Я попытался преобразовать его в pyspark с помощью оконных функций, которые...

Katelyn Raphael / 21 февраля 2019
0 голосов
0 ответов

Я должен обрабатывать миллионы данных еженедельно, поэтому написал функцию, а затем преобразовал ее...

Sonu Kumar Sharma / 20 февраля 2019
0 голосов
0 ответов

Как мне собрать заголовки или имена столбцов из строки pyspark.sql в Python?Я мог бы использовать...

Bryant / 20 февраля 2019
0 голосов
1 ответ

У меня есть четыре столбца в моем фрейме данных PySpark: 'drivers','cars'...

Mike / 20 февраля 2019
0 голосов
1 ответ

Попытка загрузить данные из таблицы оракула, где у меня есть несколько столбцов, в которых хранятся...

Shyam / 20 февраля 2019
0 голосов
2 ответов

У меня есть фрейм данных с 2 столбцами, и я получил массив ниже, выполнив df.collect () . array =...

Valli69 / 19 февраля 2019
0 голосов
0 ответов

Я пытаюсь выполнить сокращение раздела, используя условия JOIN ON, а не условия WHERE.Предлагает ли...

BubbleTea / 18 февраля 2019
0 голосов
0 ответов

Я анализирую файлы Twitter с целью взять актуальную тему в формате json с Spark SQL После того, как...

Enrique Benito Casado / 17 февраля 2019
0 голосов
0 ответов

Запрос работает хорошо через vertica, но он не работает в jdbc "pyspark", ОШИБКА: синтаксическая...

Nikolan Asad / 16 февраля 2019
0 голосов
1 ответ

У меня Spark 1.6 работает на Python 3.4, извлекает данные из моей базы данных Vertica для работы с...

Nikolan Asad / 14 февраля 2019
0 голосов
2 ответов

Я сгенерировал pyspark.sql.dataframe.DataFrame с приведенными именами столбцов и счетом. Однако я...

user3459293 / 14 февраля 2019
0 голосов
0 ответов

Я использую spark 1.6 на 3 виртуальных машинах (т.е. 1x master; 2x slave), все с 8 ядрами,...

Nikolan Asad / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь создать JSON из моего фрейма данных pyspark.Я вижу в моем фрейме данных данные...

Shankar Panda / 13 февраля 2019
0 голосов
1 ответ

Я пытаюсь получить все уникальные значения СДР и соответствующие им числа вхождений.Я пытался...

Rahul / 13 февраля 2019
0 голосов
1 ответ

Проблема: учитывая, что данные временного ряда, которые являются потоком кликов по активности...

Arghya Saha / 13 февраля 2019
0 голосов
1 ответ

У меня есть RDD ниже, который я получил от клиента.Как я могу преобразовать этот RDD в Dataframe?...

ariun ariun / 12 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...