Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
0 ответов

У меня есть два искровых кадра данных, к которым я пытаюсь присоединиться. Я пытаюсь соединить два...

Chai Goyal / 18 июня 2019
0 голосов
1 ответ

Я запускаю следующий код в сеансе оболочки pyspark. Запуск collect_list () после groupBy изменяет...

ntipakos / 17 июня 2019
1 голос
1 ответ

Я только начал работать в Pyspark, и мне нужна помощь в преобразовании типа столбца.В моем фрейме...

bchain / 17 июня 2019
1 голос
0 ответов

Вот мой код, в котором я пытаюсь создать новый фрейм данных из набора результатов моего левого...

Shanmukha / 17 июня 2019
0 голосов
0 ответов

Я хочу присоединиться к 2 df от pyspark, и там довольно много столбцов.Всякий раз, когда я пытаюсь...

Roy / 16 июня 2019
1 голос
0 ответов

У меня есть таблица примерно так: # Sample table building | date | start_time | end_time...

Gaurav Bansal / 15 июня 2019
0 голосов
0 ответов

Я заранее прошу прощения, если мой вопрос находится где-то на этом сайте. Я искал на основе слов,...

thentangler / 14 июня 2019
0 голосов
1 ответ

У меня есть сценарий, в котором я извлекаю данные в pispark DataFrame, используя spark sql.Сценарий...

Gaurav Bansal / 13 июня 2019
0 голосов
2 ответов

У меня есть фрейм данных с именем столбца и скоростью, и я хочу вычислить номер имени, скорость...

Cool Triks / 13 июня 2019
1 голос
1 ответ

Я загрузил файл паркета и создал фрейм данных, как показано ниже...

gunturu mahesh / 13 июня 2019
0 голосов
0 ответов

Я хотел бы сделать сумму агрегации массива с размером массива 100, вот моя грубая сила. (Я знаю,...

colinfang / 12 июня 2019
0 голосов
1 ответ

У меня есть один список Python с несколькими столбцами PySpark, который содержит определенные...

Luis Esteban Andaluz / 12 июня 2019
0 голосов
0 ответов

Я пытаюсь подключить Presto DB (каталог кустов) от Spark. Когда я пытаюсь подключить Presto DB с...

Sandeep / 12 июня 2019
0 голосов
1 ответ

В моем фрейме данных pyspark есть несколько столбцов, в которых, например, пусто. Входящая доставка...

Chakriare / 12 июня 2019
0 голосов
2 ответов

У меня есть 2 таблицы: Таблица 'A' и Таблица 'Lookup' Таблица A: ID Day A 1 B 1 C 2 D 4 Таблица...

SuCena / 12 июня 2019
0 голосов
0 ответов

У меня есть входной файл размером 260 ГБ, и мой объем памяти искрового кластера составляет 140 ГБ,...

BalaKumar / 11 июня 2019
5 голосов
2 ответов

У меня есть следующие данные, где данные разделены по магазинам и идентификатору месяца и...

Achyuth / 11 июня 2019
0 голосов
1 ответ

У меня есть простое требование, когда у меня есть Dataframe только с одним строковым полем с очень...

Sidd / 10 июня 2019
0 голосов
0 ответов

Я пытаюсь получить информацию о расположении раздела Base Hive из результата describe formatted db

Sidd / 10 июня 2019
1 голос
1 ответ

У меня есть таблица кустов: department ip A 10.192.168.2 B 172.16.0.1 A 10.192.168.23 B 172.16.0.24...

vishwajeet / 08 июня 2019
0 голосов
0 ответов

Я использую Spark 2.4.2 на GCP DataProc и применяю агрегирование с сохранением состояния для...

user1411837 / 08 июня 2019
0 голосов
1 ответ

Предположим, у меня есть DataFrame столбца списка StructType с именем 'arr', который можно описать...

Tony / 07 июня 2019
0 голосов
1 ответ
1 голос
0 ответов

Я читаю PySpark SQL Dataframe из индекса Elasticsearch с опцией чтения es.read.metadata=True.Я хочу...

David206 / 05 июня 2019
0 голосов
1 ответ

У меня возникла следующая проблема при использовании udfs в pyspark. Пока я не использую udfs, мой...

Pan Wolodyjowsky / 05 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...