Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов
0 голосов
1 ответ

Я пишу собственный потоковый источник Spark. Я хочу поддержать сокращение столбцов. Я не могу...

alexz00 / 29 июня 2018
0 голосов
1 ответ

У меня есть вход spark-dataframe с именем df как +---------------+---+---+---+-----------+...

PRIYA M / 29 июня 2018
0 голосов
2 ответов

В Spark 2.2 извлечение даты не работает из unix_timestamp Входные данные:...

marjun / 29 июня 2018
0 голосов
0 ответов

Есть какие-нибудь короли искры? Вариант использования: у меня есть кадр данных в 1 миллион строк, я...

Sailesh Kotha / 29 июня 2018
0 голосов
0 ответов

У меня есть искровое задание, которое выполняет чередование наименьших квадратов (ALS) на матрице...

Nik / 28 июня 2018
0 голосов
1 ответ

Документация Spark описывает, как создать нетипизированную пользовательскую агрегатную функцию (...

turtlemonvh / 28 июня 2018
0 голосов
1 ответ

Я работаю над таблицей заказов, в которой есть поля order_id и order_completion_date....

shivam gupta / 28 июня 2018
0 голосов
1 ответ

У меня есть набор данных ~ 8 ГБ с ~ 10 миллионами строк (около 10 столбцов), и я хотел доказать,...

moefinger / 28 июня 2018
0 голосов
2 ответов

Я использую спарк 1.6.3. При преобразовании столбца val1 (строки типа данных) в дату код заполняет...

Ram / 28 июня 2018
0 голосов
1 ответ

С помощью Pyspark я хотел бы присоединиться / объединить, если IP-адрес в кадре данных A находится...

andrewshih / 28 июня 2018
0 голосов
2 ответов

В основном я хотел проверить, есть ли какие-либо обновленные записи в сравнении нового файла со...

manu gupta / 28 июня 2018
0 голосов
0 ответов

У меня есть такая таблица: row | key | json 0 | a | {'something':{'a':1}} 1 | b...

Eduardo Bonet / 28 июня 2018
0 голосов
1 ответ

Я пытаюсь использовать Spark Streaming и Spark SQL с Python API. У меня есть файл, который...

darkdrake / 28 июня 2018
0 голосов
1 ответ

У меня проблема с выполнением моей искровой задачи. У меня есть две таблицы: геосетка с размерами...

Danila Zharenkov / 28 июня 2018
0 голосов
2 ответов

Мой UDF сравнивается, если разница во времени между двумя столбцами не превышает 5 дней. Если...

Dan / 28 июня 2018
0 голосов
1 ответ

У меня есть данные в следующем формате: +---------------------+----+----+---------+----------+ |...

Shrashti / 28 июня 2018
0 голосов
3 ответов

Есть ли способ динамически масштабировать объем памяти модуля Pod в зависимости от размера задания...

cryanbhu / 28 июня 2018
0 голосов
2 ответов

Я новичок в изучении sparkSQL и пытаюсь запустить примеры, представленные в документе spark, но...

HelloSpark / 28 июня 2018
0 голосов
0 ответов

У меня есть файл json, как показано ниже, и я хотел бы отсортировать его с помощью rdd. Как бы я...

Omar Hashmi / 28 июня 2018
0 голосов
0 ответов

У меня есть задание Spark 2.2, написанное в pyspark, которое пытается прочитать 300BT данных...

Costas Piliotis / 27 июня 2018
0 голосов
2 ответов

Данные выглядят так - +-----------+-----------+-----------------------------+ | id| point| data|...

sjishan / 27 июня 2018
0 голосов
2 ответов

У меня есть 2 набора данных, и я хочу создать набор данных объединения, поэтому я сделал...

Svg_af / 27 июня 2018
0 голосов
1 ответ

Будет очень трудно прочитать выходные данные, если они не в правильном формате, как показано на...

Gaurav Tambi / 27 июня 2018
0 голосов
1 ответ

У меня есть результат из набора данных ниже. 1 +------+---------+--------+ | Col1 | Col2 | NumCol |...

Garry Steve / 27 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...