Вопросы с тегом апаш-искра

0 голосов

0 ответов

Написание паркетных файлов с Scala для искры без искры в качестве зависимости

Я хочу записать свою коллекцию в файл .parquet, чтобы впоследствии ее можно было прочитать с...

Aivaras / 28 сентября 2018

0 голосов

1 ответ

Итерационные / рекурсивные алгоритмы искры - Разрыв искровой линии

У меня есть алгоритм рекурсивного искрения, который применяет скользящее окно из 10 дней к набору...

Terry Dactyl / 28 сентября 2018

0 голосов

2 ответов

Spark агрегатные строки с пользовательской функцией

Для простоты предположим, что у нас есть кадр данных, содержащий следующие данные:...

error / 28 сентября 2018

0 голосов

0 ответов

улей при ошибке искры RPC канал закрыт

Здравствуйте, я использую hive on spark для выполнения этого запроса: INSERT INTO db.table2...

Zied Hermi / 28 сентября 2018

0 голосов

2 ответов

Запросы Hive в кластере Spark

Мне нужно понять, как будет выполняться запрос улья в кластере Spark.Он будет работать как задание...

Arun S / 28 сентября 2018

0 голосов

1 ответ

Spark Executor низкая производительность при записи данных в паркет

Версия Spark: 2.3 hadoop dist: azure Hdinsight 2.6.5 Платформа: Azure Хранилище: BLOB Узлы в...

Guru / 28 сентября 2018

0 голосов

1 ответ

Java Spark.VectorAssembler не принимает String и Null

У меня большой проект со Spark с использованием Java.Я прочитал CSV-файл с более чем 1.000.000...

CCantona / 28 сентября 2018

0 голосов

1 ответ

Должен ли тип переменных широковещательной передачи быть числом или строкой при попытке перезапустить задание с контрольной точки

Когда я устанавливаю коллекцию как широковещательные переменные, она всегда возвращает мне ошибку...

willson.Yu / 28 сентября 2018

0 голосов

0 ответов

Как переделить Spark DStream Kafka ConsumerRecord RDD

Я получаю неравномерный размер тем Кафки.Мы хотим перераспределить входной RDD на основе некоторой...

Alchemist / 28 сентября 2018

0 голосов

1 ответ

Искровой потоковый кафка: неизвестная ошибка при загрузке данных для тематического раздела

Я пытаюсь прочитать тему Kafka из кластера Spark с использованием API-интерфейса структурированной...

shrinidhi joshi / 28 сентября 2018

0 голосов

0 ответов

Как повторно выполнить скала-код, представленный в кластере

Я изучаю нижеприведенные опции для повторного выполнения scala scode, представленного в...

Prashant / 28 сентября 2018

0 голосов

0 ответов

Как мне выразить эффективные СОЕДИНЕНИЯ, смешав SHUFFLE и COMBINE?

Заранее прошу прощения за долгое чтение.Мы ценим ваше терпение. У меня есть два числа A и B, а...

user758988 / 28 сентября 2018

0 голосов

2 ответов

Написание Spark SQL-запроса на данные без заголовка или схемы

Я хочу написать общий сценарий, который может выполнять запросы SQL для файла, который не имеет...

Evan Zamir / 28 сентября 2018

0 голосов

1 ответ

Преобразование плотного вектора в датафрейм с помощью Pyspark

Сначала я попробовал все по ссылке ниже, чтобы исправить мою ошибку, но ни одна из них не сработала

kkumar / 28 сентября 2018

0 голосов

2 ответов

INSERT HIVE SQL в цикле в Spark

Мы пытаемся запустить INSERT SQL для HIVE с данными, поступающими из кадра данных в Spark.В...

Voila / 28 сентября 2018

0 голосов

1 ответ

Подключение к базе данных sql от Spark

Я пытаюсь подключиться к базе данных SQL из spark, и я использовал следующие команды: scala>...

Mahadevan Swamy / 27 сентября 2018

0 голосов

1 ответ

Импорт данных из Oracle с использованием Spark

В Databricks я использую следующий код для извлечения данных из Oracle. %scala val empDF = spark

Sourav Paul / 27 сентября 2018

0 голосов

2 ответов

Прямой запрос файла против запроса фрейма данных после чтения файла

Метод 1: Запрос файла паркета напрямую как: val sqlDF = spark.sql("SELECT columns FROM parquet

Vandhana / 27 сентября 2018

0 голосов

1 ответ

Scala - Как добавить столбец в DataFrame, сохраняя исходное имя столбца?

У меня есть базовый DataFrame, содержащий все данные, и несколько производных DataFrames, которые я...

samba / 27 сентября 2018

0 голосов

2 ответов

Задачи Spark больше, чем количество разделов

Я пытаюсь сделать простой подсчет и группировать данные в наборе искр.Однако каждый раз, когда один...

Protyush Ghosh / 27 сентября 2018

0 голосов

3 ответов

Как указать или выбрать ячейку в кадре данных, Spark - Scala

Я хочу найти разницу во времени в 2 ячейки. С arrays в python я бы сделал for loop st[i+1] - st[i]...

user3577378 / 27 сентября 2018

0 голосов

1 ответ

Невозможно преобразовать объект scala в искровой фрейм данных

У меня есть объект scala, передаваемый методу dashBoardInsert, и я провел перекрестную проверку,...

shantha ramadurga / 27 сентября 2018

0 голосов

0 ответов

Невозможно добавить «org.apache.spark.ml.feature.LabeledPoint» в spark.kryo.classesToRegister в сервере заданий spark local.conf

Я использую spark 2.3.0 и последнюю версию spark-jobserver.У меня есть эти параметры сериализации в...

user1933178 / 27 сентября 2018

0 голосов

0 ответов

SparkSQL Количество задач

У меня есть отдельный Spark кластер (который состоит из двух рабочих с 2 ядрами в каждом).Я...

Jim_Spr / 27 сентября 2018

0 голосов

0 ответов

Структурированная потоковая передача с mapGroupState, вызывающая проблемы с ГХ и производительностью

В нашем приложении мы используем структурированную потоковую передачу с MapGroupWithState в...

KK2486 / 27 сентября 2018