Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
0 ответов

Я новичок в искре и у меня есть некоторые фундаментальные сомнения.Я работаю над приложением...

Amit Kushwaha / 20 мая 2019
0 голосов
1 ответ

Я хочу загрузить несколько XML-файлов (по 50 МБ каждый - около 3000 = 150 ГБ), обработать их и...

sacherus / 20 мая 2019
0 голосов
1 ответ

Запуск улья с искрой продолжает выдавать мне эту ошибку.Я пробовал много разных версий как кустов,...

Daniel Phingston / 20 мая 2019
0 голосов
1 ответ

Я написал одну функцию pyspark, но когда я запускаю ее несколько раз, она дает мне каждый раз...

suchitdreams / 20 мая 2019
0 голосов
2 ответов

Всегда получая значение Аккумулятора как 0. package com.fast.processing.data import org.apache

Tinku / 20 мая 2019
0 голосов
0 ответов

Так что я пытаюсь найти и удалить все дубликаты из набора статей, прежде чем делать некоторые НЛП...

CpILL / 20 мая 2019
1 голос
1 ответ

У меня есть искровое задание, которое случайным образом выбирает мои входные данные.Затем я создаю...

jybsuper / 20 мая 2019
1 голос
0 ответов

После установки anaconda3 и установки spark (2.3.2) я пытаюсь запустить пример кода pyspark. Это...

Rajesh P / 20 мая 2019
0 голосов
0 ответов

Я новичок в pyspark, я пишу код на python для чтения csv как rdd. Но я согласился с...

chloe hj / 20 мая 2019
1 голос
1 ответ

При запросе эластичного поиска из Spark выбирается только значение _id, но не любые значения....

Balu Vyamajala / 19 мая 2019
0 голосов
1 ответ

У меня есть 2 кадра данных, где df1 имеет столбец key1, а df2 имеет столбец key2. Здесь столбец...

Pradeep Singh / 19 мая 2019
1 голос
1 ответ

У меня есть пять Hive таблиц, предположим, что имена A, B, C, D и E. Для каждой таблицы есть ключ...

khaled / 19 мая 2019
1 голос
1 ответ

Я пытаюсь получить некоторые данные из дистрибутива Cloudera Quick Start Hadoop (для нас...

ribarcheto94 / 18 мая 2019
1 голос
2 ответов

У меня есть таблица, в которой есть столбец, содержащий массив, подобный этому - Student_ID |...

GouherDanish / 18 мая 2019
1 голос
2 ответов

Есть ли способ указать полный путь к папке jar-файлов, которые должны быть отправлены на драйвер, а...

Nitin / 18 мая 2019
0 голосов
1 ответ

Документация SnappyData (docs / program_guide / using_the_spark_shell_and_spark-submit.md)...

cryptoboy / 18 мая 2019
0 голосов
1 ответ

Я только начал использовать pyspark и не могу заставить мой UDF работать только на нужных строках....

qistoph / 17 мая 2019
1 голос
0 ответов

Я пытаюсь создать приложение Scalatra, которое запускает код с помощью spark. Я действительно могу...

Edgar / 17 мая 2019
1 голос
0 ответов

Я импортирую файлы JSON динамически (отправка нескольких имен файлов в сценарий параллельно), и...

Turner / 17 мая 2019
0 голосов
0 ответов

Я пытаюсь создать программу pyspark для подсчета количества строк, содержащих определенный шаблон...

akshay naidu / 17 мая 2019
1 голос
0 ответов

У меня есть rdd. Я хочу сгруппировать его по некоторому свойству и сохранить каждую группу в...

simpadjo / 17 мая 2019
0 голосов
2 ответов

Я новичок в Scala и Spark, я попробовал приведенный ниже код, но он не работает.Может кто-нибудь...

user2675217 / 17 мая 2019
3 голосов
2 ответов

У меня есть Seq и датафрейм.Фрейм данных содержит столбец типа массива.Я пытаюсь удалить элементы...

user3407267 / 17 мая 2019
0 голосов
1 ответ
1 голос
0 ответов

Я настроил конвейер для входящих событий из потока в Apache Kafka. Spark подключается к Kafka,...

Patrick L. / 17 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...