Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

4 голосов
2 ответов

Учитывая DataStreamReader, настроенный для подписки на несколько тем, подобных этой (см. здесь ):...

Beryllium / 11 июля 2019
0 голосов
2 ответов

Я новичок и пытаюсь решить следующую проблему. Любая помощь высоко ценится. У меня есть следующий...

sandeep singh / 11 июля 2019
1 голос
1 ответ

Я хочу сохранить файл CSV со сжатием gzip. Код выполняется успешно, но он молча завершается с...

Aviral Srivastava / 11 июля 2019
0 голосов
1 ответ

У меня есть столбец во фрейме данных spark, в котором есть несколько сообщений. Вот образец:...

DataPsycho / 11 июля 2019
1 голос
0 ответов

У меня есть искра, которая обрабатывает несколько сжатых файлов. Файлы имеют кодировку Windows 1252...

Terry Dactyl / 11 июля 2019
0 голосов
1 ответ

Я пытаюсь прочитать данные из BigQuery, используя pandas и pyspark.Я могу получить данные, но...

Aman Mittal / 11 июля 2019
1 голос
0 ответов

Я хочу получить нулевые поля от df до моего json и при этом использовал метод na.fill, чтобы...

Sanyam Jain / 11 июля 2019
0 голосов
0 ответов

В документе Spark говорится, что уровень хранилища по умолчанию - MEMORY_ONLY, однако в...

Liang2wen / 11 июля 2019
3 голосов
0 ответов

Я пытаюсь использовать scala UDF в pyspark Мой scala udf выглядит следующим образом. package com

broccoli / 11 июля 2019
0 голосов
0 ответов
1 голос
0 ответов

Я сталкиваюсь с искровым кодом для процесса ETL, в котором написаны длинные сложные SQL-операторы,...

Owais Ajaz / 10 июля 2019
0 голосов
1 ответ

Я обрабатываю файлы CSV из S3 с помощью pyspark, однако я хочу включить имя файла в качестве нового...

Chetan Yadav / 10 июля 2019
0 голосов
1 ответ

Я использую приведенный ниже код для запуска в Qubole Notebook, и код выполняется успешно. case...

Sarath Avanavu / 10 июля 2019
1 голос
1 ответ

Приведенный ниже искровой структурированный потоковый код собирает данные из Kafka каждые 10...

Kamalanathan Venkatesan / 10 июля 2019
1 голос
1 ответ

Я заархивировал три RDD и в результате получил вложенную структуру. val rdd1 = sc

samba / 10 июля 2019
0 голосов
0 ответов

Мне нужно реализовать настроенный синтаксический анализатор Spark Sql, и я нашел эту ссылку ,...

Clover / 10 июля 2019
1 голос
1 ответ

Буду благодарен, если кто-нибудь ответит мне и объяснит мне этот вопрос. Из того, что я понимаю,...

Maher Marwani / 10 июля 2019
0 голосов
1 ответ

У меня есть команда, в которой многие участники имеют разрешение отправлять задачи Spark в YARN...

Quy Doan / 10 июля 2019
0 голосов
0 ответов

изучает Spark, пытается установить искру на моем компьютере, следуя инструкции Я использую эту...

Andrey / 10 июля 2019
0 голосов
1 ответ

У меня есть список пар (id- (имя-значение)). Вот так val input = sc.parallelize(Array(Array(1,...

Phước Hữu Lưu / 10 июля 2019
0 голосов
1 ответ

Я пытаюсь собрать банку, используя sbt package. build.sbt: name := "Simple Project"...

Astro / 10 июля 2019
0 голосов
0 ответов

Я пытаюсь подключиться к Facebook через драйвер CDATA JDBC. Я использую Apache Spark. Но получаю...

Karam / 10 июля 2019
0 голосов
0 ответов

Я знаю, что эта проблема чтения большого количества маленьких файлов в HDFS всегда была проблемой и...

Neel_sama / 10 июля 2019
1 голос
1 ответ

Есть ли лучший способ написать этот запрос ... учитывая миллионы строк с использованием spark и...

user3033965 / 10 июля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...