Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
1 ответ

Я динамически генерирую строку запроса следующим образом и передаю ее в selectExpr ()....

sanjeev kumar / 18 октября 2018
0 голосов
3 ответов

У меня есть список значений в столбце в DataFrame, который я хочу использовать для фильтрации...

Taylrl / 18 октября 2018
0 голосов
1 ответ

Итак, я хочу посчитать количество нулей в кадре данных по строке. Обратите внимание, что существует...

tormond / 18 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных, как показано ниже. --------------------+ | pas1| +--------------------+...

darla / 17 октября 2018
0 голосов
1 ответ

У меня есть данные, как пример данных ниже.Я пытаюсь создать новый столбец в моих данных, используя...

user3476463 / 17 октября 2018
0 голосов
0 ответов

Я новичок в pyspark и немного смущен тем, как его использовать.У меня есть структура каталогов...

user8652313 / 16 октября 2018
0 голосов
1 ответ

Я создал фрейм данных, выполнив приведенный ниже код. from pyspark.sql import Row l =...

Sai / 16 октября 2018
0 голосов
0 ответов

Мне нужно создать фрейм данных на основе набора имен столбцов и типов данных.Но типы данных...

Spark Scala Developer / 16 октября 2018
0 голосов
1 ответ

У меня есть фрейм данных, который выглядит как +--------+---+------+----+ |group_id| id| text|type|...

unknown / 15 октября 2018
0 голосов
0 ответов

У меня отсутствует зависимость от этого фрагмента: from pyspark import SparkContext from pyspark...

Murali / 15 октября 2018
0 голосов
1 ответ

Я получаю следующую ошибку: "Caused by: java.lang.NoSuchMethodException: org.apache.spark.sql

raviraju / 15 октября 2018
0 голосов
2 ответов

Код ниже работает нормально, но если какое-либо одно поле является NULL из 5 столбцов SAL1, SAL2,...

RK. / 15 октября 2018
0 голосов
0 ответов

Следующий код выдает следующую ошибку: ОШИБКА: при вводе токенизации произошла непредвиденная...

user485868 / 12 октября 2018
0 голосов
2 ответов

Я пытаюсь выбрать данные из разделенной таблицы HIVE (разделенной на столбец - label_yyyy_mm_dd)...

KoushikDe / 12 октября 2018
0 голосов
0 ответов

Я хочу обработать несколько записей JSON одну за другой.Мой код читает несколько jsons и сохраняет...

darla / 12 октября 2018
0 голосов
0 ответов

Пример json "[{\" raja_no \ ": \" NULL \ ", \" raja_name \ ": \" sdfsdfsdf48 \ ", \" raja_date \ ":...

Raja / 11 октября 2018
0 голосов
0 ответов

Как проверить значения в функциях управления окнами в фреймах данных? Проблема: Найти строки в...

kaushikpasi / 11 октября 2018
0 голосов
1 ответ

/ * Я думаю, что мой вопрос не зависит от языка, но я использую PySpark, если это имеет значение.*...

Alexander Engelhardt / 11 октября 2018
0 голосов
1 ответ

def main(inputs, output): sdf = spark.read.csv(inputs, schema=observation_schema) sdf

Syed Ikram / 11 октября 2018
0 голосов
0 ответов

мой фрейм данных выглядит следующим образом здесь, что я хочу всякий раз, когда первое вхождение...

stackoverflow / 10 октября 2018
0 голосов
1 ответ

Я новичок в работе с Pyspark.У меня есть функция, которая вычисляет максимальное значение запроса и...

Emma Vaze / 10 октября 2018
0 голосов
1 ответ

Я недавно понял, что Spark DAG выполняются лениво, и промежуточные результаты никогда не кэшируются...

Alexander Engelhardt / 10 октября 2018
0 голосов
0 ответов

У меня есть необработанный кадр данных Spark DF.Давайте предположим простой сценарий, в котором я...

Alexander Engelhardt / 10 октября 2018
0 голосов
1 ответ

Учитывая pyspark.sql.dataframe.DataFrame x: name day earnings revenue Oliver 1 100 44 Oliver 2 200...

Zennie / 09 октября 2018
0 голосов
2 ответов

Я пытаюсь преобразовать DataFrame как Dict, используя функцию collectAsMap() в RDD. Код: dict = df

Shankar / 09 октября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...