Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов

Как транслировать фрейм данных pyspark, который содержит 4 столбца и 10 строк? Пример кадра данных:...

Vidya Sekar / 15 ноября 2018
0 голосов
2 ответов

У меня есть файл orc, при чтении с опцией ниже он читает все столбцы. val df= spark.read

user3607698 / 15 ноября 2018
0 голосов
3 ответов

Я получаю много дублирующихся столбцов после объединения двух фреймов данных, теперь я хочу удалить...

user3607698 / 15 ноября 2018
0 голосов
0 ответов

Пытаюсь использовать перекрестное применение в блокноте блоков данных Azure, выдает ошибку, что...

Mani / 15 ноября 2018
0 голосов
5 ответов

у меня есть датафрейм df.он имеет 4 столбца +-------+-------+-------+-------+ | dist1 | dist2 |...

stackoverflow / 15 ноября 2018
0 голосов
1 ответ

У меня есть искровой фрейм данных с несколькими метками и функциями, соответствующими каждому из...

Pradip Gupta / 15 ноября 2018
0 голосов
2 ответов

Мой сценарий Spark терпит неудачу, потому что корзина S3, из которой извлекается df, обновляется...

Thom Rogers / 15 ноября 2018
0 голосов
2 ответов

Мне нужно преобразовать описательный формат даты из файла журнала «МММ дд, гггг чч: мм: сс AM / PM»...

stack0114106 / 14 ноября 2018
0 голосов
0 ответов

У меня есть документ JSON, в котором есть такая запись: { "data":[ [ 1,...

bytebiscuit / 14 ноября 2018
0 голосов
1 ответ

У меня есть три разных файла orc в трех разных папках, я хочу прочитать их все в один фрейм данных...

user3607698 / 14 ноября 2018
0 голосов
1 ответ

Я пытаюсь groupBy имя столбца host и агрегировать среднее значение столбца типа...

Vicky / 14 ноября 2018
0 голосов
1 ответ

Мне нужно написать Spark SQL-запрос с внутренним выбором и разделить на. Проблема в том, что у меня...

Raskolnikov / 14 ноября 2018
0 голосов
0 ответов

Я продолжаю получать сообщение, подобное этому, ДАЖЕ, ЧЕМ файл содержит много строк: Путь к файлу...

DilTeam / 14 ноября 2018
0 голосов
2 ответов

Схема имеет dataType, объявленный как Timestamp, но задание spark не преобразует его в нужный...

Himanshu Yadav / 13 ноября 2018
0 голосов
1 ответ

Дамп данных Work_Id,Assigned_to,Date,Status R1,John,3/4/15,Not Started R1,John,3/5/15,In Progress...

Ansip / 13 ноября 2018
0 голосов
0 ответов

Я выполняю SQL-запрос Spark для нескольких столбцов информационного кадра с 200 разделами. Это...

Cuurie / 13 ноября 2018
0 голосов
3 ответов

Допустим, у меня есть искровой фрейм данных, который включает в себя категориальные столбцы (школа,...

John Subas / 13 ноября 2018
0 голосов
1 ответ

У меня есть файл Geojson, и я хочу извлечь схему (structtype), соответствующую с помощью spark....

Mak / 13 ноября 2018
0 голосов
0 ответов

У меня есть итеративный алгоритм (pyspark), в котором я обновляю часть моего Spark DataFrame. Я...

Geek88 / 13 ноября 2018
0 голосов
2 ответов

У меня есть искровой датафрейм Вот оно Я хотел бы получить значения столбца одно за другим, и мне...

RAM SHANKER G / 13 ноября 2018
0 голосов
0 ответов

Я работаю над объединением двух больших наборов данных с количеством строк 17M и 2,2M. Размер...

Akul Narang / 13 ноября 2018
0 голосов
0 ответов

Существует одно требование для реализации побитовой операции ИЛИ в одном столбце на основе группы с...

SrinivasaRao G / 13 ноября 2018
0 голосов
0 ответов

У меня есть датафрейм, имеющий столбец ниже: [Row( col_1=True, col_2=[Row(val1=70, val2=None,...

Sandie / 13 ноября 2018
0 голосов
0 ответов

Я выполняю свою искровую работу в кластере Emr, и я использую Hive Tables в качестве источника...

Sundeep Pidugu / 13 ноября 2018
0 голосов
2 ответов

Попытка загрузить CSV-файл без вывода схемы. Обычно мы создаем схему как StructType в коде искры....

Lucky / 13 ноября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...