Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

1 голос
1 ответ

Я запускаю следующий код pyspark с подключением к mongodb sparkConf = SparkConf()

Cynede / 09 октября 2019
0 голосов
0 ответов

Как загрузить / прочитать 1 ТБ данных из Oracle в Spark? Есть ли какой-то план, который я могу...

Chaitanya Krishna / 08 октября 2019
1 голос
1 ответ

Как перенести таблицу Dataframe только с одним столбцом и несколькими строками, например: 1 2 3 5 6...

Atuma / 08 октября 2019
0 голосов
1 ответ

Мне нужно разделить мои данные на 80 разделов, независимо от того, что является ключом данных, и...

Rafa / 08 октября 2019
0 голосов
0 ответов

Рассмотрим этот примерный фрейм данных data = [(dt.datetime(2000,1,1,15,20,37), dt.datetime(2000,1...

crash / 07 октября 2019
0 голосов
2 ответов

У меня есть некоторые данные, упорядоченные по dateTime, и я хочу сложить значения на основе...

Ranald Fong / 07 октября 2019
0 голосов
1 ответ

У меня есть фрейм данных PySpark, в котором у меня есть отдельные столбцы для имен, типов, дней и...

Siddharth Satpathy / 07 октября 2019
0 голосов
1 ответ

Я хотел бы проанализировать и получить значение конкретного ключа из фрейма данных PySpark SQL со...

Jena / 06 октября 2019
0 голосов
1 ответ

Это решение в теории идеально работает для того, что мне нужно, а именно для создания новой...

ark0n / 05 октября 2019
0 голосов
1 ответ

У меня есть датафрейм SparkSQL и двумерная матрица. У них одинаковое количество рядов. Я намерен...

XIN LIU / 04 октября 2019
0 голосов
2 ответов

Я пытаюсь сгладить файл JSON, чтобы иметь возможность загрузить его в PostgreSQL, все в AWS Glue. Я...

charlesperry / 04 октября 2019
1 голос
1 ответ

Я хочу создать новый столбец на основе некоторого условия в pyspark. Мой фрейм данных - id...

Nikita Agarwal / 04 октября 2019
0 голосов
1 ответ

Я хочу рассчитать возраст и из поля DOB. Но в моем коде я тяжело его кодирую. Но нужно делать...

Pallavi Verma / 04 октября 2019
0 голосов
0 ответов

Я сталкиваюсь с тем, что, я думаю, является основной проблемой, но мне на удивление трудно найти...

Jay Cee / 03 октября 2019
0 голосов
0 ответов

из того, что я понимаю, запускается разделение заданий с помощью операций Action и разделение...

sparrow tian / 03 октября 2019
1 голос
1 ответ

У меня есть фрейм данных с двумя столбцами типа списка. Я пытаюсь получить третий столбец, который...

rusty_rockstar / 02 октября 2019
0 голосов
0 ответов

Я пытаюсь найти наиболее эффективный способ перебрать тысячи файлов в озере данных и объединить все...

asher / 02 октября 2019
0 голосов
2 ответов

У меня есть кадр данных в следующем формате ... id , name, start_date, end_date , active 1 , albert...

user2870492 / 30 сентября 2019
0 голосов
3 ответов

У меня есть набор данных, который выглядит так: |id |статус |open_date |имя | |8 |активный...

Neli / 30 сентября 2019
0 голосов
1 ответ

Я создал фрейм данных следующим образом spark= SparkSession.builder.appName("test")

sanjeev kumar / 30 сентября 2019
0 голосов
1 ответ

У меня есть запрос (приведенный ниже), и когда я его запускаю, иногда Spark выдает эту ошибку - org

marie20 / 29 сентября 2019
2 голосов
1 ответ

Я хочу удалить строки в PySpark DataFrame, где определенный столбец содержит пустую карту. Как мне...

iamyojimbo / 29 сентября 2019
0 голосов
0 ответов

Я использую Apache spark с python для чтения CSV-файлов, он хорошо читает тип данных, за...

nimeresam / 29 сентября 2019
0 голосов
1 ответ

У меня есть простой запрос, который объединяет две таблицы, как показано ниже: select p.policy_id,...

marie20 / 26 сентября 2019
0 голосов
0 ответов

Я написал ниже функцию в pyspark, чтобы получить deptid и вернуть фрейм данных, который я хочу...

Ravi / 26 сентября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...