Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
0 ответов

У меня есть большой стол в сжатом (snappy, gzip, lzo) формате паркета.Я проверяю время для разных...

user16316 / 22 сентября 2018
0 голосов
1 ответ

Я пытаюсь сделать UDF для панд, который принимает два столбца с целочисленными значениями и на...

UneagerAngryBeaver / 21 сентября 2018
0 голосов
1 ответ

Я новичок в PySpark, но мне удалось заставить работать ниже. У меня есть еще 2 требования, оба из...

kikee1222 / 21 сентября 2018
0 голосов
2 ответов

Есть ли быстрый и эффективный способ разворачивать данные?Я использовал следующие методы, и хотя...

RonD / 21 сентября 2018
0 голосов
0 ответов

У меня есть pyspark.sql.dataframe, который выглядит так n наблюдений, от '2' до следующих n...

cdixon3 / 21 сентября 2018
0 голосов
1 ответ

Я новичок в PySpark и работаю над сценарием, читая из .csv файлов. Я четко определил схему ниже, и...

kikee1222 / 20 сентября 2018
0 голосов
2 ответов

ПРИМЕЧАНИЕ. Это только краткий пример данных.Не имеет смысла по сравнению с реальной командой по...

AntonyP / 20 сентября 2018
0 голосов
1 ответ

Я работаю с большим набором данных, который имеет около 6000 миллионов записей, я успешно выполнил...

Shail / 19 сентября 2018
0 голосов
1 ответ

Я пытаюсь записать записи DF в таблицу Teradata, используя Spark JDBC. Пример кода: df.write

Shankar / 18 сентября 2018
0 голосов
0 ответов

У меня есть SQL-запрос, к которому я должен получить доступ в PySpark (DataBricks).из-за сложного...

Sanjiv Rai / 18 сентября 2018
0 голосов
0 ответов

Я пытаюсь получить широту из функции udf в качестве возвращаемого значения для извлечения в новый...

amol desai / 18 сентября 2018
0 голосов
1 ответ

У меня есть два файла. У меня есть файл, в котором я создаю sparkcontext. create_spark.py Код такой...

Atif / 17 сентября 2018
0 голосов
0 ответов

Я пытаюсь вставить Spark DataFrame в таблицу Teradata, используя соединение spark sql jdbc. Код:...

Shankar / 16 сентября 2018
0 голосов
0 ответов

Я делаю курс UCSanDiegoX: DSE230x на edx.В части о пользовательских функциях используется этот код:...

Sören / 15 сентября 2018
0 голосов
1 ответ

У меня есть документ json, имеющий такую ​​форму (обратите внимание, что эта схема не находится под...

Jared / 14 сентября 2018
0 голосов
1 ответ

запрос с использованием: df= (df1.alias('a') .join(df2, a.id == df2.id,...

Sandy / 14 сентября 2018
0 голосов
1 ответ

Я написал код на python, который я пытаюсь переместить в PySpark, но столкнулся с проблемой...

Shail / 14 сентября 2018
0 голосов
2 ответов

Я пытаюсь разделить сеансы из набора данных lastfm, следуя ответу от https://www.arundhaj

user2635060 / 14 сентября 2018
0 голосов
1 ответ

Я пытаюсь найти все отдельные значения в каждом столбце в кадре данных и показать в одной таблице....

LEJ / 13 сентября 2018
0 голосов
1 ответ

У меня есть библиотека, написанная на Scala, в которой есть некоторые функции для загрузки данных...

rabejens / 13 сентября 2018
0 голосов
1 ответ

У меня есть датафрейм со многими столбцами.Моя цель - создать фрейм данных, в котором будет указано...

LEJ / 12 сентября 2018
0 голосов
1 ответ

Я хотел бы сгруппировать набор данных и вычислить для каждой группы минимум переменной, игнорируя...

Valentina / 12 сентября 2018
0 голосов
1 ответ

Я скачал spark версии 2.3.1 и hadoop version 2.7 и java jdk 8. Все отлично работает для простых...

abraham foto / 11 сентября 2018
0 голосов
1 ответ

У меня есть таблица, в которой отсутствуют некоторые разделы.Когда я вызываю его в улье, он отлично...

lsmor / 11 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...