Вопросы с тегом pyspark-SQL - PullRequest

Вопросы с тегом pyspark-SQL

0 голосов
1 ответ

У меня есть таблица Hive, в которой есть столбец типа данных struct (пример ниже).Таблица создана в...

CP7 / 19 ноября 2018
0 голосов
1 ответ

Я недавно нашел сайт SnappyData.Меня интересует производительность запросов SparkSQL.Есть...

hiropon / 17 ноября 2018
0 голосов
1 ответ

Мне нужно найти последние записи full_national_number на основе даты.Может кто-нибудь предложить...

Abhishek Allamsetty / 16 ноября 2018
0 голосов
0 ответов

Я пытаюсь выполнить запрос, использующий Spark SQL, из блокнота Zeppelin, подключенного к AWS Glue....

Spandan Brahmbhatt / 16 ноября 2018
0 голосов
1 ответ

Я использую фрейм данных pyspark.У меня есть код, в котором я пытаюсь преобразовать dataframe в rdd...

mimi gigi / 15 ноября 2018
0 голосов
1 ответ

У меня есть следующие данные: id type price 1 us 1.99 1 ca 2.99 2 ca 1.99 3 au 2.99 3 us 3.99 3 ca...

dunkky / 15 ноября 2018
0 голосов
1 ответ

У меня есть этот DataFrame в PySpark: [Row(id='487', value=35185, time=datetime

Doman / 15 ноября 2018
0 голосов
1 ответ

Я допускал странное поведение при работе с PySpark sqlContext.Проблема лучше всего...

Radek Nevyhoštěný / 14 ноября 2018
0 голосов
2 ответов

У меня есть два кадра данных pyspark: | A | B | C | | 21 | 999 | 1000| | 22 | 786 | 1978| | 23 |...

Qubix / 14 ноября 2018
0 голосов
3 ответов

У меня есть большой фрейм данных, в котором в одном столбце, называемом location, есть только...

Qubix / 14 ноября 2018
0 голосов
1 ответ

Я использую кластер Spark в режиме standalone. Доступны оба узла: главный и рабочий, с журналами в...

edouardtheron / 13 ноября 2018
0 голосов
1 ответ

У меня есть фрейм данных со значениями меток времени, например: 2018-02-15T11: 39: 13.000Z Я хочу...

Ticoincoin / 13 ноября 2018
0 голосов
0 ответов

Я работаю над объединением двух больших наборов данных с количеством строк 17M и 2,2M. Размер...

Akul Narang / 13 ноября 2018
0 голосов
2 ответов

Я хочу создать новый фрейм данных из существующего фрейма данных в pyspark.Фрейм данных "df"...

amol desai / 09 ноября 2018
0 голосов
2 ответов

Как вставить новые данные в существующую таблицу ??? Я пытаюсь вставить новые данные в существующую...

phan hien / 08 ноября 2018
0 голосов
0 ответов

У меня есть данные временных рядов в PySpark DataFrame. Каждому из моих сигналов (столбец value)...

user200017 / 08 ноября 2018
0 голосов
1 ответ

Я хочу сохранить порядок сортировки даты, используя collect_list для нескольких столбцов, все с...

mwhee / 08 ноября 2018
0 голосов
3 ответов

мой вопрос о том, как получить доступ к таблице ACE HIVE в Spark sql?

aniket kale / 08 ноября 2018
0 голосов
1 ответ

Я использую pyspark 2.3.1 и хотел бы фильтровать элементы массива с помощью выражения, а не...

Maciej A. Bednarz / 07 ноября 2018
0 голосов
0 ответов

Я немного запутался: У меня есть скрипт ниже. Я преобразовал искровой DF в Pandas DF для выполнения...

kikee1222 / 07 ноября 2018
0 голосов
1 ответ

У меня есть фрейм данных pyspark со столбцами «Имя» и «Среднее имя». Столбец среднего имени...

Umi / 06 ноября 2018
0 голосов
1 ответ
0 голосов
2 ответов

У меня есть датафрейм, как показано ниже +---+---+---+ | t1| t2|t3 | +---+---+---+ |0 |1 |0 |...

Sai / 04 ноября 2018
0 голосов
1 ответ

Фрейм Hi Data создан, как показано ниже. df = sc.parallelize([ (1, 3), (2, 3), (3, 2), (4,2), (1,...

Miguel A. Friginal / 02 ноября 2018
0 голосов
1 ответ

У меня есть фрейм данных с тремя столбцами, и я пытаюсь сделать линейный график с использованием...

upendra / 01 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...