Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
4 ответов

У меня есть фрейм данных Spark в следующем формате. df = spark.createDataFrame([(1, 2, 3), (1, 4,...

Rinaz Belhaj / 15 января 2019
0 голосов
1 ответ

У меня есть библиотека Scala, которая содержит некоторые служебные коды и UDF для API Scala Spark....

Georg Heiler / 15 января 2019
0 голосов
1 ответ

Я обрабатываю большой запрос с использованием искрового фрейма данных, и он занимает так много...

minyo / 15 января 2019
0 голосов
2 ответов

У меня есть потоковый источник Kafka с JSON, например, {"type":"abc"...

SLU / 15 января 2019
0 голосов
2 ответов

Мне нужно экспортировать данные из тем Hive в темы Kafka, основываясь на некоторых событиях в...

Srijit / 15 января 2019
0 голосов
0 ответов

Я хочу подключить MongoDB к Apache Spark для Mac. Итак, я установил python 3.7, Apache Spark, mongo...

옥광진 / 15 января 2019
0 голосов
0 ответов

У меня очень большая структура, которая создается во время выполнения задания, которая имеет...

ss5972 / 15 января 2019
0 голосов
0 ответов

У меня есть примерно 100 ГБ данных, которые я пытаюсь обработать. Данные имеют вид: | timestamp |...

tlanigan / 15 января 2019
0 голосов
1 ответ

Я реализую метод buildScan API источника данных Spark v1. override def buildScan(requiredColumns:...

Pallavi / 15 января 2019
0 голосов
1 ответ

Я пытаюсь преобразовать ниже Teradata SQL в Spark SQL, но не могу. Может кто-нибудь предложить...

user1496783 / 15 января 2019
0 голосов
1 ответ

Я пытаюсь получить данные из темы kafka и помещаю их в папку hdfs. Я столкнулся со следующей...

BigD / 15 января 2019
0 голосов
1 ответ

Имея эту схему: root |-- Elems: array (nullable = true) | |-- element: struct (containsNull = true)...

rvilla / 14 января 2019
0 голосов
0 ответов

Я не могу настроить Spark SQL так, чтобы я мог получить доступ к Hive Table в Spark Thrift Server...

oskarryn / 14 января 2019
0 голосов
1 ответ

У нас большой проект с несколькими наборами тестов, и в каждом наборе в среднем 3 теста. Для наших...

Farah / 14 января 2019
0 голосов
1 ответ

У меня проблемы с интеграцией искры с кафкой. Я использовал spark-streaming-kafka-0-8. Я компилирую...

andrea5 / 14 января 2019
0 голосов
1 ответ

В моей программе Scala у меня есть фрейм данных со схемой: root |-- FIRST_NAME: string (nullable =...

Priyesh Chhabra / 14 января 2019
0 голосов
0 ответов

Я использую приложение Spark2 , которое использует следующую команду из com.mongodb.spark

aloplop85 / 14 января 2019
0 голосов
0 ответов

Позвольте мне разбить эту проблему на меньший кусок. У меня есть DataFrame в PySpark, где у меня...

cph_sto / 14 января 2019
0 голосов
2 ответов

Я знаю, что это очень специфическая проблема, и не принято публиковать подобные вопросы в...

Qubix / 14 января 2019
0 голосов
0 ответов

У меня есть приложение для потокового воспроизведения, мне нужно подписаться на несколько тем для...

Bankelaal / 14 января 2019
0 голосов
0 ответов

Чтобы создать СДР в Spark Streaming, как мне оценить правильный интервал между партиями, чтобы мои...

Rahul Singh / 14 января 2019
0 голосов
1 ответ

У меня есть проект Spark в Scala, в котором я пытаюсь использовать зависимость google-cloud-storage

kaysush / 14 января 2019
0 голосов
1 ответ

Как сохранить смещение сообщения в Kafka, если я использую KafkaUtils.createDirectStream для чтения...

user1326784 / 14 января 2019
0 голосов
0 ответов

Я использовал контрольные точки в потоковой передаче искры, и она создает отдельные папки для...

RajData / 14 января 2019
0 голосов
0 ответов

Я использую тему Кафки с startingOffsets, установленным на earliest. Срок хранения кластера...

lfk / 14 января 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...