Вопросы с тегом Apache-искровой SQL

0 голосов

0 ответов

Ошибка SQL-запроса в PySpark при использовании временной таблицы

У меня есть SQL-запрос, к которому я должен получить доступ в PySpark (DataBricks).из-за сложного...

Sanjiv Rai / 18 сентября 2018

0 голосов

1 ответ

Альтернатива использования запроса на выборку в случае, когда оператор в spark sql

Я пытаюсь выполнить запрос с select в case when операторе. как то так: select case when cust_id in...

Vishal D / 17 сентября 2018

0 голосов

1 ответ

Фильтровать столбцы таблицы и маршрут к другой таблице, если она пуста

Я не очень разбираюсь в SQL, но все же хотел бы спросить этот форум. Моя задача - обрабатывать...

user1708054 / 13 сентября 2018

0 голосов

3 ответов

Можем ли мы запустить традиционный запрос соединения в spark sql

Предположим, у меня есть две таблицы: table1 и table2. Формируемый запрос выглядит так: select *...

dexter / 11 сентября 2018

0 голосов

1 ответ

Функция PySpark / Spark Window Первый / Последний выпуск

Насколько я понимаю, первая / последняя функция в Spark будет извлекать первую / последнюю строку...

Nikhil Redij / 11 сентября 2018

0 голосов

0 ответов

Курсор SQL подвергнут рефакторингу в конечный автомат Python в кластере Spark

Сейчас я поддерживаю большое хранилище данных, реализованное в MS SQL и SSIS, которое обновляется...

user545241 / 10 сентября 2018

0 голосов

1 ответ

выберите количество городов с населением более 410000

Я новичок в sql. у меня есть в таблице данные, как district city state population d1 c1 s1 2000 d2...

pooja / 06 сентября 2018

0 голосов

0 ответов

Чтение из таблицы кустов (Parque) и сохранение в виде текстового файла

Я прочитал данные из таблицы Hive, отсортированные как файл Parquet, в DF. После применения...

Vinit / 06 сентября 2018

0 голосов

0 ответов

Добавление столбца с подсветкой (0) в набор искровых данных, если столбец отсутствует

Есть ли способ добавить новый столбец со значениями 0 в набор данных spark, если выбор столбца...

John Humanyun / 04 сентября 2018

0 голосов

3 ответов

Формат даты Scala

У меня есть data_date, который дает формат ггггммдд: beginDate = Some(LocalDate

Misha / 29 августа 2018

0 голосов

0 ответов

Добавить пользовательские функции с оптимизацией (следовательно, не как UDF)

Я борюсь с оптимизацией моих пользовательских функций, которые в настоящее время передаются как UDF

aasthetic / 29 августа 2018

0 голосов

1 ответ

python / dataframe - групповые столбцы для создания списка

Я пытаюсь использовать dataframe для преобразования данных: Column 1 | Column 2 | Column 3 | Column...

jbpm / 28 августа 2018

0 голосов

2 ответов

Как получить определенную строку и столбец из DataFrame в Azure Databricks Spark

У меня есть DataFrame в Azure Databricks, который выглядит как Col a| Col b ------------ Marc |...

STORM / 26 августа 2018

0 голосов

1 ответ

Предварительная группировка таблиц в HDFS и чтение в Spark с нулевым перемешиванием

Контекст У меня есть две таблицы, к которым я присоединяюсь / объединяюсь как часть моих искровых...

naj / 24 августа 2018

0 голосов

1 ответ

План выполнения Spark SQL в Spark 2.3 слишком медленный

Я обновил нашу систему HDP (Hortonworks Data Platform) с 2.5.2 до новейших версий (2.6.5). Все...

Phong Pham / 06 июля 2018

0 голосов

0 ответов

искра - ошибка переполнения стека - org.apache.spark.sql.catalyst.plans.QueryPlan

Запустил задание spark (v2.1.1), которое объединяет 2-е число (одно - файл .txt из S3, другое -...

tooptoop4 / 03 июля 2018

0 голосов

1 ответ

Конкат данных с несколькими скалами

У меня есть несколько DFS, которые я хочу объединить в 1 большой DF +----+----------+----------+...

Misha / 28 июня 2018

0 голосов

2 ответов

Как узнать, что мои данные перекошены?

После переноса моих данных (предположим, таблицы) в HDFS я понятия не имею, как реплицируются мои...

Saxena / 27 июня 2018

0 голосов

0 ответов

Создайте последовательность иерархии, используя GraphX spark lib для соединения Hive ниже

Ниже id образца набора данных для транзакций, в которых "t_id" и "parent_id" имеют отношения...

Sampat Kumar / 26 июня 2018

0 голосов

2 ответов

Ограничение Mysql необходимо вернуть n% случайных записей из таблицы

полностью застрял, используйте разные подходы, но все же не повезло, я использую MySQl и SparkSql....

Andrey / 25 июня 2018

0 голосов

2 ответов

Записать искровой фрейм в существующую таблицу кустов паркета

Хотите записать искровой фрейм в существующую таблицу кустов паркета.Я могу сделать это, используя...

Rahul / 11 июня 2018

0 голосов

1 ответ

Spark Java java.lang.NoClassDefFoundError при использовании классов в jar артефакта

Я создал несколько классов в своем проекте maven и создал файл jar с использованием артефакта...

Soheil Pourbafrani / 11 июня 2018

0 голосов

3 ответов

Макс зарплата с одним GroupBy без Joins

Схема для РАБОТНИКА (ID, EMPLOYEENAME, SALARY, ORGANIZATIONID) Запрос для решения: найдите имена...

Karan Sharma / 09 июня 2018

0 голосов

1 ответ

Как получить или создать клиент Hadoop от Spark Executor

Есть ли способ получить Hadoop FileSystem от Spark Executor при выполнении операции mapPartitions...

miguel0afd / 09 июня 2018

0 голосов

0 ответов

преобразование массива [dataframe] в dataframe в scala

следующее возвращает df1 как Array [DataFrame] или Array [Seq] val df1 = df.rdd.collect.map (f =>...

Nitisha / 09 июня 2018