Вопросы с тегом апаш-искровой SQL

0 голосов

0 ответов

Невозможно прочитать таблицу Hive, используя sparkR submit

Вот мой код: sc <- sparkR.init(master = "local[*]", sparkEnvir = list(spark.driver

Manoj / 17 сентября 2018

0 голосов

0 ответов

Исключение при подключении к Hbase с использованием Spark

Я подключаюсь к Hbase, используя Spark. Я добавил все зависимости, но все равно получаю это...

Nirmal / 17 сентября 2018

0 голосов

0 ответов

потоковое твиттер <typeError>

ошибка при потоковой передаче def get_tweets(): url = 'https://stream.twitter.com/1

Amin / 17 сентября 2018

0 голосов

1 ответ

Переименуйте пробел в имени столбца в файле Parquet, используя spark sql

Я хочу показать содержимое файла паркета с помощью Spark Sql, но поскольку имена столбцов в файле...

Rahul Wagh / 16 сентября 2018

0 голосов

1 ответ

перераспределение искры неравномерно, все еще перекошено

Как я могу форсировать (в основном) равномерное распределение? Я хочу выполнить что-то вроде: df

Georg Heiler / 16 сентября 2018

0 голосов

1 ответ

где DataFrameWriter.bucketBy () хранит данные?

Я пытаюсь использовать метод DataFrameWriter.bucketBy () для формирования вывода по заданным...

Shankar / 16 сентября 2018

0 голосов

3 ответов

Используйте Spark Scala для преобразования плоских данных во вложенный объект

Мне нужна помощь в преобразовании плоского набора данных во вложенный формат с помощью Apache Spark...

Rushy Nova / 16 сентября 2018

0 голосов

0 ответов

как сделать параллельное соединение с терадатами используя Spark SQL

Я пытаюсь вставить Spark DataFrame в таблицу Teradata, используя соединение spark sql jdbc. Код:...

Shankar / 16 сентября 2018

0 голосов

0 ответов

Spark FlatMapGroupsWithStateFunction throws не может разрешить named_struct () из-за несоответствия типов данных SerializeFromObject

Я использую FlatMapGroupsWithStateFunction в моем приложении для потоковой передачи....

Robin Kuttaiah / 16 сентября 2018

0 голосов

0 ответов

Spark работа для агрегирования данных о Кассандре

Я новичок в искре.У меня есть следующая таблица в Кассандре: CREATE TABLE cust_actions ( orgid text...

Tarun / 16 сентября 2018

0 голосов

0 ответов

Поток PySpark: Py4JJavaError: AnalysisException: 'Таблица или представление не найдены: твиты;линия 1 поз 23 '

, когда я запускаю в py spark streaming на ноутбуке jupyter, получая следующую ошибку, любая помощь...

Amin / 16 сентября 2018

0 голосов

0 ответов

Почему я вижу OOM в моем задании на искру, когда общий размер ввода увеличивается, но размер ввода для одной задачи остается неизменным?

Я запускаю искровое задание, которое получает данные, уже разделенные на разделы размером 10 МБ...

user10368401 / 15 сентября 2018

0 голосов

2 ответов

Как вывести сгенерированный Java-код на стандартный вывод?

Используя DataFrames в Apache Spark 2. +, есть ли способ получить базовые RDD и вывести...

Midiparse / 15 сентября 2018

0 голосов

0 ответов

PySpark Dataframe - перебирать раздел окна

Давайте предположим, что у нас есть такие данные (отсортированные по времени) и мы создали...

Sankalp Tomar / 15 сентября 2018

0 голосов

2 ответов

Spark Dataset / Dataframe объединяют NULL ключ перекоса

Работая с объединениями Spark Dataset / DataFrame, я столкнулся с длительным запуском и не смог...

Mikhail Dubkov / 15 сентября 2018

0 голосов

1 ответ

Как объединить два фрейма данных pyspark для операции Arraytype?

У меня есть два кадра данных, A и B. У каждого есть столбец с именем 'names', а этот...

J. Shawn / 15 сентября 2018

0 голосов

1 ответ

Как я могу ссылаться на столбец с дефисом в его имени в выражении столбца pyspark?

У меня есть документ json, имеющий такую форму (обратите внимание, что эта схема не находится под...

Jared / 14 сентября 2018

0 голосов

0 ответов

Как проанализировать столбец объекта json внутри CSV с помощью Spark SQL

У меня возникла проблема при чтении и анализе файла CSV.У меня есть JSON в столбце с именем CONTENT

Ravi Kumar / 14 сентября 2018

0 голосов

1 ответ

искровая запись: источник данных CSV не поддерживает нулевой тип данных

У меня ошибка в моем коде.Код сбрасывает некоторые данные в базу данных Redshift. После некоторых...

Oleg Pavliv / 14 сентября 2018

0 голосов

1 ответ

рабочие места с логикой условной фильтрации для нескольких арендаторов

У меня есть таблица типа tenant_id,start_date,end_date,use_fancy_transformation 1,20180101,20180201...

Georg Heiler / 14 сентября 2018

0 голосов

3 ответов

Фильтрация и подсчет отрицательных / положительных значений из фрейма данных Spark с использованием pyspark?

Понятия не имею, как отфильтровать положительные или отрицательные значения в столбце с помощью...

Giordan Pretelin / 14 сентября 2018

0 голосов

2 ответов

Промежуток времени между двумя заданиями в Spark

Я вставляю данные в таблицу улья с итерациями в искре. Например: скажем, 10 000 элементов, сначала...

baris / 14 сентября 2018

0 голосов

1 ответ

pyspark обрабатывает и сравнивает 2 кадра

Я работаю над pyspark (Spark 2.2.0) с двумя фреймами данных, которые имеют общие столбцы.Требование...

msashish / 14 сентября 2018

0 голосов

0 ответов

Как обрабатывать логи в режиме Spark Cluster

Я новичок в Spark. Я не могу узнать, как обрабатывать журналы в режиме Spark Cluster. Я добавил...

akshay / 14 сентября 2018

0 голосов

0 ответов

Получение сообщения об ошибке com.typesafe.config.ConfigException $ Отсутствует: не найден параметр конфигурации для ключевого приложения

Я отправляю искровое задание в режиме кластера, используя следующую команду и передавая stage.cde

Prashant Sahoo / 14 сентября 2018