Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

3 голосов
1 ответ

У меня есть следующий pyspark df: +------------------+--------+-------+ | ID| Assets|Revenue|...

himi64 / 07 марта 2019
3 голосов
1 ответ

Контекст: Мне нужно отфильтровать фрейм данных на основе того, что содержит столбец другого фрейма,...

LePuppy / 07 марта 2019
0 голосов
1 ответ

У меня есть папка, содержащая файлы SQL (для схемы) и заархивированные файлы (файлы CSV). Я хочу...

Naveen Yadav / 07 марта 2019
0 голосов
1 ответ

Как минимизировать время выполнения моего запроса с помощью pyspark? Я использую базу данных...

Srinivasan E / 07 марта 2019
0 голосов
1 ответ

В pyspark у меня есть следующее: import pyspark.sql.functions as F cc = F.lit(1)

lezebulon / 07 марта 2019
0 голосов
1 ответ

Афины таблицы "организация" считывают данные из паркетных файлов в s3.Мне нужно изменить имя...

sandy / 06 марта 2019
0 голосов
1 ответ

Я работаю с pyspark sql api и пытаюсь сгруппировать строки с повторяющимися значениями в список...

jKraut / 06 марта 2019
0 голосов
0 ответов

В пользовательском интерфейсе Spark тег этапа показывает задачи и DAG https://www.waitingforcode

Joe C / 06 марта 2019
0 голосов
1 ответ

Я новичок в PySpark и пытаюсь читать HDFS-файлы (на которых созданы таблицы кустов) и создавать...

rightjoin / 06 марта 2019
0 голосов
0 ответов

У меня есть фрейм данных, который состоит из 3 строк и более 20 столбцов (даты) +----+-----+-----+...

Gerasimos / 05 марта 2019
0 голосов
0 ответов

У меня следующая проблема: я использую PySpark для чтения таблицы из Snowflake в качестве кадра...

Gerasimos / 05 марта 2019
0 голосов
1 ответ

Я использую pyspark для генерации фрейма данных, в котором мне нужно обновить столбец 'amt'...

Nabarun Chakraborti / 05 марта 2019
0 голосов
0 ответов

В пользовательском интерфейсе spark есть вкладка SQL.Он может отображать детали запроса в виде...

Joe C / 05 марта 2019
0 голосов
0 ответов

Я пытаюсь прочитать индексasticsearch с помощью Pyspark (v1.6.3), но получаю следующую ошибку Я...

Vaibhav Bacchav / 02 марта 2019
0 голосов
1 ответ

В настоящее время я пытаюсь решить проблему, когда у меня есть большая строка текста (резюме), и я...

ImNewToThis / 01 марта 2019
0 голосов
1 ответ

Мне нужно обновить значение задержки для штрих-кода (offset=1) до штрих-кода case when (...

Katelyn Raphael / 01 марта 2019
0 голосов
1 ответ

Я использую Python 2.7 и версию 2.2.0.Я создаю фрейм данных в pyspark, который имеет тип столбца...

Anubhav Jain / 28 февраля 2019
0 голосов
0 ответов

У меня есть приведенный ниже фрагмент кода для чтения данных из таблицы Postgresql, из которой я...

Abhi / 28 февраля 2019
0 голосов
0 ответов

Данные можно найти здесь, это относительно небольшой файл json, который я нашел на github.Я пытаюсь...

MrL / 27 февраля 2019
0 голосов
0 ответов

Я запускаю pyspark в кластере EMR, но получаю сообщение об ошибке при преобразовании SQL-запроса...

funkyFunk / 27 февраля 2019
0 голосов
0 ответов

В настоящее время я работаю с 3 фреймами данных и объединяю их вместе, начиная с фрейма network и...

sectechguy / 27 февраля 2019
0 голосов
2 ответов

У меня есть таблица HIVE с именем столбца, похожим на: column_"COLUMN_NAME" Мой...

Erik Hallin / 25 февраля 2019
0 голосов
0 ответов

Интересно, как можно использовать бинарный поиск в очень частом запросе кадра данных pyspark,...

BernardG / 25 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...