Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов

Я пытаюсь создать новые кадры данных, используя столбцы исходного кадра данных (df0). Я пытался...

Aziz Azizos / 13 февраля 2019
0 голосов
2 ответов

Мне интересно, как можно настроить параметры таблицы, используемые DataFrameWriter#saveAsTable....

Peter G. Horvath / 12 февраля 2019
0 голосов
2 ответов

Я хотел бы использовать Spark для разбора сетевых сообщений и группировки их в логические объекты с...

Joachim / 12 февраля 2019
0 голосов
0 ответов

Я попытался вставить данные в таблицу с помощью запроса select, используя sparksql в Databricks.Но...

pythonUser / 12 февраля 2019
0 голосов
2 ответов

Я пытаюсь прочитать несколько CSV-файлов с помощью Pyspark, данные обрабатываются Amazon Kinesis...

Nicolò Gasparini / 12 февраля 2019
0 голосов
1 ответ

Я пытаюсь вставить данные в управляемую таблицу Hive, в которой есть раздел. Показать выходные...

rajusem / 12 февраля 2019
0 голосов
0 ответов

Я пытаюсь загрузить CSV-файл как секционированную таблицу Hive, используя Spark SQL и запустить...

Soheil Pourbafrani / 12 февраля 2019
0 голосов
2 ответов

Я хотел бы сравнить 2 фрейма данных и вытащить записи, основанные на условиях ниже 3. Если запись...

RK. / 12 февраля 2019
0 голосов
1 ответ

Я хочу обработать данные из объекта org.apache.spark.sql.Dataset, которые я получаю из spark.sql...

chaitanya ekre / 12 февраля 2019
0 голосов
1 ответ

Я пытаюсь сгруппировать по одному столбцу DataFrame и генерировать значения min и max столбца...

Rick Haffey / 12 февраля 2019
0 голосов
1 ответ

Что мне нужно сделать? Создать схему для DataFrame, которая должна выглядеть следующим образом:...

Andronicus / 12 февраля 2019
0 голосов
1 ответ

У меня есть dataframe, в котором есть две группы столбцов info.name и info.value: id |info.name

Adas Kavaliauskas / 11 февраля 2019
0 голосов
1 ответ

Ввод: +---------+ |full_name| +---------+ | $raja| | #raja| | .raja| Ожидаемый вывод: +---------+...

Surender Raja / 11 февраля 2019
0 голосов
1 ответ

Я хочу сопоставить свои поля меток времени в наборе данных со значениями, такими как...

aiman / 11 февраля 2019
0 голосов
1 ответ

Моя версия pyspark - 2.1.1.Я пытаюсь объединить два кадра данных (слева), имеющих два столбца id и...

Parikshit Maheshwari / 11 февраля 2019
0 голосов
1 ответ
0 голосов
1 ответ

Я пытаюсь переместить данные из greenplum в HDFS с помощью Spark.Я могу успешно прочитать данные из...

Photon / 11 февраля 2019
0 голосов
2 ответов

Я хочу создать новый столбец, который является средним значением продаж за предыдущий день,...

Ayush Mishra / 11 февраля 2019
0 голосов
2 ответов

Поворот не работает должным образом большую часть времени, т. Е. Увеличивает записи исходной...

Shyam / 11 февраля 2019
0 голосов
1 ответ

Я прочитал учетные записи из текстового файла, который использует , в качестве разделителя: val csv...

kn3l / 11 февраля 2019
0 голосов
1 ответ

Я пытаюсь настроить одно из значений столбца на основе значения в каком-либо другом фрейме данных

Alex / 11 февраля 2019
0 голосов
0 ответов

У меня есть код pyspark, преобразующий фрейм данных pyspark через функцию в несколько фреймов...

toby / 11 февраля 2019
0 голосов
0 ответов

Мне нужна помощь со следующим фрагментом кода def query(self, inputs=[], start=None, end=None):...

Maik / 10 февраля 2019
0 голосов
1 ответ

У меня есть агрегированный DataFrame со столбцом, созданным с использованием collect_set.Теперь мне...

shakedzy / 10 февраля 2019
0 голосов
1 ответ

У меня есть следующая таблица: DEST_COUNTRY_NAME ORIGIN_COUNTRY_NAME count United States Romania 15...

Manu Chadha / 10 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...