Вопросы с тегом апаш-искровой SQL

0 голосов

0 ответов

Написание собственного Spark SQL Parser

Мне нужно реализовать настроенный синтаксический анализатор Spark Sql, и я нашел эту ссылку ,...

Clover / 10 июля 2019

0 голосов

0 ответов

Исключение в потоке "main" java.lang.UnsupportedClassVersionError: org / apache / spark / launcher / Main

изучает Spark, пытается установить искру на моем компьютере, следуя инструкции Я использую эту...

Andrey / 10 июля 2019

0 голосов

0 ответов

CDATA JDBC Драйвер для Facebook

Я пытаюсь подключиться к Facebook через драйвер CDATA JDBC. Я использую Apache Spark. Но получаю...

Karam / 10 июля 2019

0 голосов

0 ответов

Ошибка при сборе данных из столбца dataframe в Pyspark

Я использую Pyspark (Python 3.7 с Spark 2.4) и имею небольшую строку кода для сбора даты из одного...

Sidd / 10 июля 2019

1 голос

1 ответ

Spark-Scala: фильтрация набора данных Spark на основе нескольких столбцов и условий

Мне сложно найти хороший способ отфильтровать набор данных искры. Я описал основную проблему ниже:...

fletchr / 10 июля 2019

0 голосов

0 ответов

Ищу помощь UDF преобразования чисел с плавающей запятой

Я использую UDF для преобразования схемы в JSON, и на основе схемы JSON, когда схема имеет ключ...

dniwu / 09 июля 2019

0 голосов

1 ответ

В Spark, как записать заголовок в файл, если в кадре данных нет строки?

Я хочу записать заголовок в файл, если в фрейме данных нет строки. В настоящее время, когда я...

Bilal Shafqat / 09 июля 2019

1 голос

0 ответов

Попытка создать несколько искровых фреймов данных на каждом уровне вложенного XML-файла.

ТАК Я использую версию сообщества databricks для анализа xml-файла в искровых фреймах с...

Zaibi / 09 июля 2019

1 голос

1 ответ

Заменить \ "на" "в Spark SQL

Данные, к которым я обращаюсь, содержат \", и мне нужно иметь возможность преобразовать их в...

user2684198 / 09 июля 2019

0 голосов

0 ответов

Передать строку в UDF и выбрать столбец на основе сопоставления с образцом

Как я могу добиться следующего, передав строку в udf? val df1 = df.withColumn("col_Z",...

femibyte / 09 июля 2019

0 голосов

2 ответов

Порядок столбцов Spark Union

Недавно я встретил что-то странное в SparkНасколько я понимаю, учитывая метод хранения на основе...

Charles Du / 08 июля 2019

0 голосов

0 ответов

Подключение к удаленному серверу улья без загруженного куста

Я пытаюсь получить доступ к кластеру Hive без загрузки Hive на моей машине. Я прочитал здесь, что...

Hunter Mitchell / 08 июля 2019

1 голос

1 ответ

Невозможно отфильтровать столбцы CSV, хранящиеся в кадре данных в Spark 2.2.0

Я читаю файл CSV с моего локального компьютера, используя spark и scala, и сохраняю данные в фрейм...

Antony / 08 июля 2019

1 голос

1 ответ

Невозможно запросить сложные операторы SQL из таблицы кустов с помощью pyspark

Привет! Я пытаюсь запросить таблицу улья из контекста искры. мой код: from pyspark.sql import...

P A / 08 июля 2019

0 голосов

1 ответ

сравнить столбец даты с максимальной датой в spark sql

Использование Spark2.3.0 и Scala Имея таблицу, подобную приведенной ниже: created_date mth ColA...

Shabhana / 08 июля 2019

0 голосов

0 ответов

реализация сложных типов данных поверх объединенных данных

Я объединил данные из двух таблиц и хочу преобразовать их в сложный тип данных (Map). // creating...

Yogendra Kumar / 08 июля 2019

0 голосов

0 ответов

Обработка очень больших изображений параллельно с использованием Spark

Я должен выполнить некоторую обработку (распознавание образов) на очень больших изображениях (более...

peter_hutvagner / 07 июля 2019

1 голос

0 ответов

Spark агрегатное значение из столбца многомерного массива

Набор данных содержит один столбец многомерного массива с родительскими и дочерними отношениями...

user1394349 / 07 июля 2019

1 голос

1 ответ

Невозможно обменять раздел куста с помощью spark sql даже после использования enableHiveSupport ()

Я пытаюсь вставить инкрементные данные в базовую таблицу кустов.Для этого я подготовил данные в...

Photon / 06 июля 2019

1 голос

1 ответ

Загрузка папок для паркета в спарк-фрейм в зависимости от состояния

У меня есть каталог, в котором есть папки на основе даты, а дата выполнения является частью имени...

Srini / 06 июля 2019

0 голосов

1 ответ

Pyspark dataframe - конвертировать данные кортежей в строки

Я хочу преобразовать данные кортежа в фрейме данных pyspark в строки на основе двух ключей....

Jack / 05 июля 2019

0 голосов

0 ответов

Каков наиболее эффективный и эффективный способ построения графика из необработанных данных?

У меня есть набор данных, содержащий упоминания различных тем в Reddit, который выглядит следующим...

iRoygbiv / 05 июля 2019

1 голос

1 ответ

Добавление номеров строк при разборе многих файлов CSV с помощью Spark

В настоящее время Spark анализирует большое количество небольших CSV-файлов в одном большом кадре...

Tilo Wiklund / 05 июля 2019

0 голосов

0 ответов

Загрузить данные в базу данных Oracle

писатель: DataFrameWriter writer .format("jdbc") .option("url",...

chandan gupta / 05 июля 2019

1 голос

1 ответ

Как манипулировать Spark Dataframe в R с помощью sparklyr?

Я работаю в среде Spark и пытаюсь манипулировать некоторыми данными, которые появляются как...

Wilson dos Anjos Junior / 05 июля 2019