Вопросы с тегом апаш-искровой SQL

0 голосов

2 ответов

Сравните даты в scala, присутствующие в столбце данных

Я пытаюсь сравнить даты ниже в фильтре, как показано ниже: - фрейм данных KIN_PRC_FILE имеет...

shubham / 28 ноября 2018

0 голосов

0 ответов

Спецификация списка столбцов в инструкции INSERT OVERWRITE

При попытке перезаписать таблицу Hive с определенными столбцами из Spark (Pyspark) с использованием...

Joby / 28 ноября 2018

0 голосов

1 ответ

Является ли spark sql чувствительным к регистру?

Похоже, что spark sql чувствителен к регистру для похожих запросов, верно? spark.sql("select...

djohon / 28 ноября 2018

0 голосов

2 ответов

PySpark: как читать в столбцах разбиения при чтении паркета

У меня есть данные, хранящиеся в файлах паркета и таблице кустов, разделенные по годам, месяцам и...

ira / 28 ноября 2018

0 голосов

1 ответ

Как реализовать собственный десериализатор для потока Kafka с использованием структурированной потоковой передачи Spark?

Я пытаюсь перенести мое текущее потоковое приложение, основанное на использовании RDD (из их...

user3275784 / 28 ноября 2018

0 голосов

1 ответ

как сгруппировать столбцы без функции агрегации в пандах?

У меня есть следующий код, написанный в pyspark sql, который выглядит следующим образом: dep_cus =...

subash poudel / 28 ноября 2018

0 голосов

2 ответов

добавление двух определенных фреймов данных в фрейм данных spark scala для API spark

У меня есть обработанный фрейм данных, который я хочу добавить к исходному фрейму данных.Но это...

San / 28 ноября 2018

0 голосов

1 ответ

Столбец метки времени Spark dataframe, выведенный по состоянию на InvalidType из таблицы БД Mapr

Я читал таблицу из БД MapR со Spark.Но столбец отметки времени выводится как InvalidType.При чтении...

Hasif Subair / 28 ноября 2018

0 голосов

1 ответ

Spark - чтение из Hive и создание строго типизированного набора данных без класса case

Я использую spark для чтения данных из таблицы Hive, и мне действительно нужен строго...

Shay / 27 ноября 2018

0 голосов

3 ответов

Создайте функцию Spark udf для перебора массива байтов и преобразования ее в числовой

У меня есть Dataframe с массивом байтов в spark (python) DF.select(DF.myfield).show(1, False)...

Ftagn / 27 ноября 2018

0 голосов

1 ответ

Apache Spark Scala - вставка куста в "слишком большую ошибку фрейма данных"

Я пытаюсь вставить в Hive, используя приведенный ниже код, но по какой-то причине он всегда терпит...

Srinivas / 27 ноября 2018

0 голосов

1 ответ

Коррелированный подзапрос сгруппированного выражения - TreeNodeException: Binding атрибут, tree: count (1) # 382L

Допустим, я пытаюсь сделать некоторую статистику по некоторым выборочным данным, которые состоят из...

Matthias / 27 ноября 2018

0 голосов

0 ответов

перемещение данных из очереди jms в таблицу кустов

Мне нужно прочитать данные JMS activemq и отправить их в hadoop, чтобы их можно было открыть через...

user1708054 / 27 ноября 2018

0 голосов

0 ответов

Spark SQL: MovingAverage, исключая верхние 10% и нижние 10%

Мне нужно найти скользящее среднее значение временного ряда, разделенное полем «ReportId».Я...

Remis Haroon / 27 ноября 2018

0 голосов

1 ответ

PySpark DataFrame меняет столбец строки на массив перед использованием разнесения

У меня есть столбец с именем event_data в формате json в моем искровом DataFrame, после прочтения...

SarahData / 27 ноября 2018

0 голосов

0 ответов

Pyspark - взять общую сумму столбца и использовать значение, чтобы разделить другой столбец

У меня есть фрейм данных df >>> df = spark.createDataFrame([[1,0], [2,1], [3,1], [4,0], [5...

Clock Slave / 27 ноября 2018

0 голосов

1 ответ

Динамическая подготовка и выполнение запросов в спарк

В Spark этот json находится в фрейме данных (DF), теперь нам нужно перейти к таблицам (в json на...

swcraft / 27 ноября 2018

0 голосов

1 ответ

Преобразуйте все определенные столбцы типов данных в другие типы данных программно в Scala Spark

Я программно пытаюсь преобразовать типы данных столбцов и сталкиваюсь с некоторыми проблемами...

Leothorn / 27 ноября 2018

0 голосов

0 ответов

Использование Reg_ex в Spark Data Frame в Scala

У меня есть следующий журнал 2015-07-22T09:00:28.019143Z,marketpalce-shop,263.242.248.130:54635,10

San / 27 ноября 2018

0 голосов

2 ответов

Сортировать Spark Dataframe с двумя столбцами в различном порядке

Допустим, у меня есть такая таблица: A,B 2,6 1,2 1,3 1,5 2,3 Я хочу отсортировать ее по возрастанию...

kello / 27 ноября 2018

0 голосов

0 ответов

Удалить столбец в структуре внутри типа Array

Моя схема выглядит следующим образом root |-- source: string (nullable = true) |-- results: array...

suprita shankar / 27 ноября 2018

0 голосов

3 ответов

Как заменить пробел в Spark (с помощью Scala)?

У меня есть такой файл журнала.Я хочу создать DataFrame в Scala. 2015-05-13T23:39:43.945958Z...

San / 26 ноября 2018

0 голосов

1 ответ

Как вернуть строки с нулевыми значениями в pyspark dataframe?

Я пытаюсь получить строки с нулевыми значениями из фрейма данных pyspark.В пандах я могу добиться...

dg S / 26 ноября 2018

0 голосов

0 ответов

Тиражирование искровых блоков

Я хотел бы знать, возможно ли определить логику репликации, чтобы перетасовать блоки без...

minsky / 26 ноября 2018

0 голосов

1 ответ

Spark SQL 2.3+ поддерживает UDT?

Я проходил этот билет и не мог понять, поддерживает ли Spark UDT в версии 2.3+ на любом языке...

Suny Tyagi / 26 ноября 2018