Вопросы с тегом pyspark-sql - PullRequest

Вопросы с тегом pyspark-sql

0 голосов
0 ответов

У меня есть следующий код: a) Создать экземпляр Local Spark: # Load data from local machine into...

user1761806 / 02 января 2019
0 голосов
2 ответов

У меня есть следующий код: # Get the min and max dates minDate, maxDate = df2.select(f

user1761806 / 02 января 2019
0 голосов
1 ответ

Я пытаюсь написать скрипт в блоках данных, который будет выбирать файл на основе определенных...

Carltonp / 02 января 2019
0 голосов
0 ответов

Я пытаюсь вычислить взвешенное (основанное на длительности) скользящее среднее для кадра данных с...

delivaldez / 02 января 2019
0 голосов
3 ответов

Мне нужно просканировать таблицу Hive и добавить значения из первой записи в последовательности ко...

DinoG / 31 декабря 2018
0 голосов
2 ответов

Извините, я новичок в питоне.При изучении pyspark я наткнулся на такую ​​команду sc = SparkSession

Naz / 30 декабря 2018
0 голосов
2 ответов

введите описание изображения здесь Я могу подключиться к MYSQL во время выполнения моего кода...

TEJASWAKUMAR SIRIGIRI / 29 декабря 2018
0 голосов
2 ответов

У меня есть таблица формата AVRO в HIVE.Один из столбцов (строковый тип данных) в этой таблице...

Koushik Chandra / 29 декабря 2018
0 голосов
2 ответов

Имея разделенную таблицу Hive CREATE EXTERNAL TABLE IF NOT EXISTS CUSTOMER_PART ( NAME string , AGE...

Joby / 28 декабря 2018
0 голосов
1 ответ

Я хочу получить все строки из одного DataFrame (df1) так, чтобы его id находилось в пределах + - 10...

user10835311 / 26 декабря 2018
0 голосов
1 ответ

Я очень новичок в PySpark. Я запускаю сценарий (в основном создаю tfidf и прогнозирую 9...

lU5er / 25 декабря 2018
0 голосов
1 ответ

У меня большой массив данных из 3000 переменных.Я хотел бы разделить это на 3 кадра данных по 1000,...

Kruthika Kulkarni / 25 декабря 2018
0 голосов
2 ответов

Например, набор данных, это файл csv- Name , Country, Income Alan Turing, UK, 1000 James Clark, US,...

Phoenix14 / 23 декабря 2018
0 голосов
3 ответов

У меня есть фрейм данных (df) , а внутри фрейма данных у меня есть столбец user_id df = sc

Data_101 / 21 декабря 2018
0 голосов
1 ответ

Я пытаюсь сгенерировать новый столбец, который является массивом над окном, однако кажется, что...

ImNewToThis / 20 декабря 2018
0 голосов
1 ответ
0 голосов
1 ответ

Пытаетесь удалить повторяющиеся имена столбцов в pyspark df после присоединения к таблицам hdfs?...

vagautam / 20 декабря 2018
0 голосов
2 ответов

Я пытаюсь добавить новый столбец, в котором он показывает сумму двойных (столбец вещи для...

ImNewToThis / 19 декабря 2018
0 голосов
0 ответов

У меня проблемы с переводом представления БД Oracle в Spark SQL, работающий на AWS Glue.Исходное...

Bryan / 18 декабря 2018
0 голосов
1 ответ

У меня есть DataFrame, содержащий 752 (идентификатор, дата и 750 столбцов объектов) и около 1,5...

Shrashti / 18 декабря 2018
0 голосов
2 ответов

В чем разница между двумя способами объединения двух фреймов данных Pyspark.1. Использование...

Rishabh Mishra / 18 декабря 2018
0 голосов
1 ответ

У меня есть файл фиксированной ширины, как показано ниже 00120181120xyz12341 00220180203abc56792...

user2935539 / 17 декабря 2018
0 голосов
2 ответов

У меня есть два кадра данных, скажем dfA и dfB. Я хочу взять их пересечение, а затем посчитать...

Qubix / 17 декабря 2018
0 голосов
1 ответ

Я использую Spark 2.3.1 и хочу использовать toPandas() (для использования unique()). Когда я...

Abhi / 17 декабря 2018
0 голосов
1 ответ

Я пробовал приведенный ниже код - riders.write.csv(path="/loudacre/devices4_csv",...

Phoenix14 / 17 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...