Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
0 ответов

Мне нужно прочитать и обработать подмножество строк внутри фрейма данных в pyspark с SQL, возможно...

Marcos Toro / 03 декабря 2018
0 голосов
1 ответ

Проблема: у меня 2 кадра данных; У df1 есть coil_id, sample_factor, seq.Каждый идентификатор...

Abhinavneni / 29 ноября 2018
0 голосов
1 ответ

чтение файла паркета с помощью spark df = spark.read.parquet("path_to_file") df.show(2)...

Tushar Kolhe / 29 ноября 2018
0 голосов
1 ответ

Я очень рад, что Spark позволяет мне установить JDBC-соединение с таблицей базы данных, а затем...

Ziggy Eunicien / 29 ноября 2018
0 голосов
1 ответ

В PySpark модуль перераспределения имеет необязательный аргумент столбцов, который, конечно, будет...

veronik / 29 ноября 2018
0 голосов
0 ответов

При попытке перезаписать таблицу Hive с определенными столбцами из Spark (Pyspark) с использованием...

Joby / 28 ноября 2018
0 голосов
0 ответов

Существует ли функция в Pyspark или Scala для t-теста Student ?Цель состоит в том, чтобы проверить,...

Alexandra Lorenzo / 27 ноября 2018
0 голосов
1 ответ

Допустим, я пытаюсь сделать некоторую статистику по некоторым выборочным данным, которые состоят из...

Matthias / 27 ноября 2018
0 голосов
1 ответ

Я пытаюсь получить строки с нулевыми значениями из фрейма данных pyspark.В пандах я могу добиться...

dg S / 26 ноября 2018
0 голосов
1 ответ

Я работаю над приложением PySpark для анализа авиационных данных.База данных является БД MS...

Karan94 / 26 ноября 2018
0 голосов
2 ответов

Я пытаюсь создать вложенный JSON из моего фрейма данных искры, который имеет данные в следующей...

Shankar Panda / 26 ноября 2018
0 голосов
1 ответ

Я бы хотел сравнить два фрейма данных pyspark и получить различия в новой таблице. Я протестировал...

MVachelard / 23 ноября 2018
0 голосов
3 ответов

Я пытаюсь преобразовать мой pyspark sql dataframe в json, а затем сохранить в виде файла. df_final...

Shankar Panda / 22 ноября 2018
0 голосов
1 ответ

Я пытаюсь рассчитать статистику для каждого числового поля.Но я застрял здесь, как исключить null...

Shankar Panda / 22 ноября 2018
0 голосов
1 ответ

Я отправляю имя столбца в цикле for и хочу использовать эту переменную (которая содержит имя...

Shankar Panda / 21 ноября 2018
0 голосов
0 ответов

У нас есть кластер Cassandra, и я пишу код pyspark для извлечения данных из Cassandra в кластер...

Ashwani Singh / 21 ноября 2018
0 голосов
3 ответов

У меня есть pyspark dataframe с большим количеством столбцов, и я хочу выбрать те, которые содержат...

Manrique / 21 ноября 2018
0 голосов
0 ответов

Я пытаюсь преобразовать столбцы из строки в метку времени с помощью этого кода from pyspark.sql...

SpecialOneDz / 21 ноября 2018
0 голосов
1 ответ

Я пытаюсь записать результаты переменной в CSV-файл, а затем создать из него JSON.Каждая итерация...

Shankar Panda / 21 ноября 2018
0 голосов
1 ответ

Как передать значение ключа словаря Python в фрейм данных where в Pyspark ... Словарь Python, как...

Bharath R / 21 ноября 2018
0 голосов
1 ответ

Моя проблема заключается в следующем: Table 1 ID1 ID2 1 2 3 4 Table 2 C1 VALUE 1 London 4 Texas...

Alok / 20 ноября 2018
0 голосов
1 ответ

import pyspark.sql.functions as F from pyspark.sql.window import Window Я хотел бы использовать...

Dan / 20 ноября 2018
0 голосов
1 ответ

Я пытаюсь найти минимум, максимум каждого поля, полученного из оператора sql, и записать его в файл...

Shankar Panda / 20 ноября 2018
0 голосов
2 ответов

Я пытаюсь отправить результат sql в цикл for.Я новичок в Spark и Python, пожалуйста, помогите. from...

Shankar Panda / 20 ноября 2018
0 голосов
1 ответ

У меня есть CSV-файл со следующей структурой USER_ID location timestamp 1 1001 19:11:39 5-2-2010 1...

imed eddines / 19 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...