Вопросы с тегом апаш-искровой SQL

0 голосов

1 ответ

Как выполнить групповые и агрегатные операции на спарк SQL

Как выполнить групповое задание по искру sql. Я не могу группировать по одному конкретному столбцу...

BigD / 08 января 2019

0 голосов

0 ответов

объединить несколько CSV в одну большую таблицу AVRO

У меня есть несколько csvs с разными заголовками. некоторые из них имеют 12 столбцов, некоторые 14...

matterwaves / 08 января 2019

0 голосов

1 ответ

Существует ли решение Spark SQL Only для применения приведения к сложному столбцу (map, struct)

Существует ли решение Spark SQL Only для применения приведения к сложному столбцу, как показано...

sujit / 08 января 2019

0 голосов

2 ответов

Перераспределение искры не работает, как ожидалось

Я использую spark-sql 2.3.1, я установил spark.sql.shuffle.partitions=40 в моем коде ' val...

Shyam / 08 января 2019

0 голосов

1 ответ

Возникли проблемы при вставке искрового фрейма данных в таблицу Phoenix из-за несоответствия столбцов

Я создаю таблицу феникса со структурой ниже CREATE TABLE IF NOT EXISTS "TEST1"(...

Akjpunia / 08 января 2019

0 голосов

0 ответов

Некоторые значения типов данных теряются после написания искры scala

Я новичок в искре. У меня есть датафрейм, как показано ниже. Это пример кадра данных, ID имеет 32...

CRV / 08 января 2019

0 голосов

1 ответ

Spark Scala - проблема с синтаксисом разбивающей строки

я пытаюсь разбить строку в столбце DataFrame, используя SparkSQL и Scala, и, кажется, есть разница...

Karan Alang / 08 января 2019

0 голосов

1 ответ

Как использовать кластеризацию Zorder при написании дельта-таблицы в PySpark?

Я пытаюсь написать очень большой фрейм данных PySpark, следуя совету, который я вижу в...

con / 07 января 2019

0 голосов

2 ответов

Сравнение двух фреймов данных в Spark (производительность)

Мне нужно сравнить два кадра данных в моем искровом приложении. Я прошел следующий пост. Как...

Ajay Vepakomma / 07 января 2019

0 голосов

0 ответов

Как представить в данных во фрейме данных как побитовое представление?

Я хочу заменить значение в кадре данных некоторым битовым представлением id val1 val1 first 2 4...

Kiran Pg / 07 января 2019

0 голосов

2 ответов

Spark Агрегирование нескольких столбцов (возможно для массива) из выходных данных соединения

У меня ниже наборов данных Table1 Table2 Теперь я бы хотел получить набор данных ниже. Я попытался...

Naveen Nelamali / 07 января 2019

0 голосов

1 ответ

Как преобразовать from_unixtime в to_utc_timestamp в том же кадре данных без добавления новых столбцов?

var columnnames = "callStart_t, callend_t" // Имена столбцов временной метки являются динамическим...

stack0114104 / 07 января 2019

0 голосов

1 ответ

удалите все специальные символы из CSV-файла, используя спарк

как удалить все специальные символы из csv-файла из фрейма данных spark, используя java spark...

pragadeeshwaran venkatachalam / 07 января 2019

0 голосов

1 ответ

Параллельные запросы API с использованием Spark и Scala

Я использую Spark 2.4.0 и Scala 2.11. У меня есть набор данных [Users], когда Users состоит из:...

Ben Haim Shani / 07 января 2019

0 голосов

0 ответов

Проблема потоковой передачи при записи в приемник памяти, хотя приемник консоли работает нормально

Я пытаюсь прочитать данные JSON для моего проекта при чтении потоковых данных с использованием...

smx0 / 07 января 2019

0 голосов

1 ответ

Scala отфильтровывает строки в объединенном df на основе 2 столбцов с одинаковыми значениями - лучший способ

Я сравниваю 2 кадра данных. Я хочу сравнить их столбец за столбцом Я создал 2 меньших кадра данных...

banditKing / 06 января 2019

0 голосов

2 ответов

Как получить значение местоположения для таблицы Hive, используя объект Spark?

Меня интересует возможность получения значения location таблицы Hive для объекта Spark...

codeshark / 06 января 2019

0 голосов

2 ответов

Как вывести список файлов в корзину S3 с помощью Spark Session?

Можно ли перечислить все файлы по заданному пути S3 (например, s3: //my-bucket/my-folder/*

codeshark / 06 января 2019

0 голосов

0 ответов

Apache Spark и операция слияния путем замены существующих строк в таблице AWS Redshift

Я выполняю преобразование в приложении Apache Spark, а затем должен обновить таблицу AWS Redshift...

alexanoid / 05 января 2019

0 голосов

1 ответ

AWS SageMaker Spark SQL

Я знаю, например, что с предложением Qubole Hive, в котором используются записные книжки Zeppelin,...

Nibroc A Rehpotsirhc / 05 января 2019

0 голосов

0 ответов

Лучшее решение использовать любой брокер сообщений для спрей-данных

Я использую алгоритм для пометки поля монго и на основании этого я добавляю новое поле в этот...

sharan sharma / 05 января 2019

0 голосов

1 ответ

Разница между Spark и Hive с помощью команды ANALYZE TABLE -

Команда ANALYZE TABLE, запускаемая из Spark для таблицы Hive, не дает такого же улучшения...

DinoG / 04 января 2019

0 голосов

0 ответов

spark scala Машинное обучение Не удалось найти значение по умолчанию для порогов

Когда я выполняю свой код локально, с тем же набором данных, хранящимся в локальной файловой...

SimbaPK / 04 января 2019

0 голосов

0 ответов

Счетчик строк в Spark Структурированные потоковые Sql

Сценарий: работа с Spark Streaming в структурированном SQL. Я должен реализовать набор данных...

Tizianoreica / 04 января 2019

0 голосов

2 ответов

Несколько групп по и несколько отображения счетчика на спарк sql?

Я новичок в Spark, и я просто хочу задать вам этот вопрос, связанный с Spark SQL. Давайте...

salamanka44 / 04 января 2019