Вопросы с тегом Apache-искра

0 голосов

0 ответов

Использование spark sql jdbc источника данных params dbtable и partitionColumn для запроса диапазона первичных ключей

Я запрашиваю таблицу mysql со столбцом первичного ключа, используя spark. Мне не нужно читать всю...

Kundan Jha / 17 июня 2019

1 голос

3 ответов

Сбор первых N записей для каждого ключа в KeyVal RDD в PySpark

У меня есть СДР с большим количеством записей KeyVal. Один и тот же ключ будет присутствовать...

AstroAT / 16 июня 2019

0 голосов

2 ответов

Как читать файлы из HDFS с помощью Spark?

Я создал систему рекомендаций с использованием Apache Spark с наборами данных, хранящимися локально...

Dastamn / 15 июня 2019

0 голосов

1 ответ

Как преобразовать, используя разнесение с пользовательской модификацией для других отдельных столбцов и в то же время

У меня есть набор данных, подобный следующему: Input Dataset Id, Parent_id, Data...

Shivakanth Komatreddy / 14 июня 2019

0 голосов

1 ответ

Интеграция искры и кафки, исключение в Spark-представить банку

Получает NullPointerException при отправке файла jar , который объединяет kafka с искрой под Ubuntu...

Ahmad / 14 июня 2019

0 голосов

0 ответов

Как рассчитать Moving AVG

Что ж, у меня проблема с rangeBetween, я не знаю, как добраться до скользящей средней. это моя...

Rhoufrane Ismaili / 14 июня 2019

0 голосов

1 ответ

Spark Не могу найти зависимости

Я новичок в Spark и пытаюсь запустить NaiveBayes из этого примера: https://github

Shin Yu Wu / 14 июня 2019

0 голосов

0 ответов

Загрузка данных Кафки в реальном времени в HBase через PySpark;вызвать зоопарка слишком много соединений

Я пытаюсь настроить поступление данных Кафки в реальном времени в HBase через PySpark.У меня...

Chopin / 14 июня 2019

3 голосов

1 ответ

PySpark разбивает строковый массив словарей на строки

У меня есть фрейм данных pyspark со столбцом StringType (edges), который содержит список словарей...

SoHei / 14 июня 2019

0 голосов

2 ответов

Преобразование искрового фрейма данных в плоский файл .csv

У меня есть искровой фрейм данных (здесь и далее spark_df), и я хотел бы преобразовать его в формат...

Rotail / 13 июня 2019

0 голосов

1 ответ

Ошибка конвейера PySpark при использовании индексатора и кодера

Я использую банковские данные из UCI , чтобы просто создать шаблон проекта.Я следовал руководству...

Andre / 13 июня 2019

1 голос

1 ответ

PySpark новый столбец, который выбирает значение из списка целых чисел

DBA108642 / 13 июня 2019

1 голос

1 ответ

DataFrame.write.parquet - Parquet-файл не может быть прочитан HIVE или Impala

Я написал DataFrame с pySpark в HDFS с помощью этой команды: df.repartition(col("year"))\...

Markus / 13 июня 2019

1 голос

1 ответ

При использовании метода void метод 'локальное имя класса несовместимо с именем класса потока "void" "при де / сериализации через Spark

При попытке создать тест для приложения, использующего Spark, я сталкиваюсь со следующей ошибкой:...

luk2302 / 13 июня 2019

0 голосов

1 ответ

Как добавить новую колонку относительно максимального элемента?

У меня есть искровой фрейм данных из CSV-элемента. csv_df = sqlContext.read.format("csv")

mgnfcnt2 / 13 июня 2019

0 голосов

1 ответ

Как заменить groupBy более эффективным методом

Моя задача - анализировать логи Кеннеди Космического Центра с помощью Apache Spark. Код работает,...

powercat / 13 июня 2019

0 голосов

0 ответов

Apache Spark Java - проблемы с компиляцией примера оценки Pi

Я новичок в Apache Spark.Начиная с https://spark.apache.org/examples.html, я пытался скомпилировать...

sysuser / 13 июня 2019

0 голосов

0 ответов

Как преобразовать символ Разделитель записей в перевод строки

Здравствуйте, я использую для этого pyspark porpouse У меня есть текстовый файл, который содержит...

Julio / 12 июня 2019

0 голосов

1 ответ

Объединить несколько фреймов данных в PySpark

У меня есть следующие несколько фреймов данных, которые имеют два столбца в каждом и имеют...

Miguel A. Friginal / 12 июня 2019

0 голосов

2 ответов

Объединение с таблицей поиска в PySpark

У меня есть 2 таблицы: Таблица 'A' и Таблица 'Lookup' Таблица A: ID Day A 1 B 1 C 2 D 4 Таблица...

SuCena / 12 июня 2019

5 голосов

2 ответов

Оконная функция Разблокируйте связь с другим полем, чтобы получить последнюю запись

У меня есть следующие данные, где данные разделены по магазинам и идентификатору месяца и...

Achyuth / 11 июня 2019

1 голос

1 ответ

Hive on Spark не возвращает результатов при агрегации или запросах к объединению

Агрегация или объединение не возвращают результатов запросов Hive на внешнюю таблицу. У меня...

Stefano Castoldi / 10 июня 2019

1 голос

1 ответ

Apache Spark с Java: запуск нескольких запросов приложений одновременно

Мы использовали spark с java и создали Java REST api для вызова нашего spark кода. После вызова...

Rajashekhar Meesala / 10 июня 2019

0 голосов

1 ответ

Spark структурированная потоковая передача - возможно ли использовать функциональность Spark структурированного окна без агрегирования?

Я работаю над набором данных CSV и обрабатываю их с помощью потоковой передачи. Я могу применить...

Chaitanya Kulkarni / 09 июня 2019

0 голосов

0 ответов

Spark в Java - как выполнить модульное тестирование sparkSession.read.load?

sparkSession.read().load("some_path") означает чтение файла паркета, сохраненного в HDFS...

coderz / 07 июня 2019