Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

Я экспериментирую с запуском структурированной потоковой передачи из источника kafka и возвращаю их...

irrelevantUser / 13 сентября 2018
0 голосов
1 ответ

У меня локально настроен спарк 2.2, и я работаю со scala Конфигурация сеанса спарка ниже val...

Gourav Soni / 13 сентября 2018
0 голосов
3 ответов

Вы можете видеть вывод команды lscpu - jack@042:~$ lscpu Architecture: x86_64 CPU op-mode(s):...

cph_sto / 13 сентября 2018
0 голосов
1 ответ

У меня есть набор данных, загруженный из файла .csv (здесь имитируется ds), который содержит 2...

Jesse / 13 сентября 2018
0 голосов
1 ответ

У меня есть конвейер данных пакетной обработки на платформе Cloudera Hadoop - файлы обрабатываются...

Desdemona Underwood / 13 сентября 2018
0 голосов
0 ответов

Я пытаюсь прочитать данные от производителя kafka в формате json. На сервере разработки у меня есть...

Farman Ali / 13 сентября 2018
0 голосов
0 ответов

Я работаю над реализацией потокового приложения Spark, и мне нужно удалить дубликаты строк на...

scalacode / 13 сентября 2018
0 голосов
0 ответов

У меня есть Spark и Hadoop кластер, которые были построены с Docker Swarm.Они идентифицируются в...

ugur / 13 сентября 2018
0 голосов
2 ответов

Я использую PySpark в Spark 2.3.1 в AWS EMR (Python 2.7.14) spark = SparkSession \ .builder \

Acid Rider / 13 сентября 2018
0 голосов
1 ответ

Я поместил инструкции log.info внутри своей UDF, но в кластере происходит сбой.Местные работают...

prianshu / 13 сентября 2018
0 голосов
1 ответ

У меня есть два фрейма данных, один из которых имеет уникальное значение id, а другой может иметь...

experiment / 13 сентября 2018
0 голосов
0 ответов

Как рассчитать соотношение между количеством разделов и размером DataFrame в конфигурации Spark с...

Robert Almeida / 13 сентября 2018
0 голосов
1 ответ

У нас есть цель HIVE с хранением как паркет.Задания Informatica BDM настроены на использование...

Sridar V / 13 сентября 2018
0 голосов
2 ответов

При чтении в файле ORC в Spark, если вы укажете столбец раздела в пути, этот столбец не будет...

alexgbelov / 12 сентября 2018
0 голосов
2 ответов

У меня есть программа, которая берет данные из вложенных каталогов и затем обрабатывает их.Я думал,...

user2896120 / 12 сентября 2018
0 голосов
2 ответов

У меня есть датафрейм, который выглядит следующим образом: column1_ID column2 column3 column4 A_123...

Vivek Narayanasetty / 12 сентября 2018
0 голосов
1 ответ

Возможно ли добавить / заменить существующее выражение столбца в DataFrame API / SQL с...

user3479897 / 12 сентября 2018
0 голосов
2 ответов

Я пытаюсь выполнить агрегацию с последующим самостоятельным объединением в структурированном потоке...

redsk / 12 сентября 2018
0 голосов
1 ответ

У меня есть работа, которая читает CSV-файлы, конвертирует их во фреймы данных и записывает в...

Ayan Biswas / 12 сентября 2018
0 голосов
0 ответов

Я использую Spark на компьютере с Windows. Я новичок и при создании RDD из файла tsv я столкнулся с...

Manu Bhogal / 12 сентября 2018
0 голосов
1 ответ

Я новичок в искре и пытаюсь научиться этому Я пытаюсь создать набор данных из textFile, используя...

Swaraj Shekhar / 12 сентября 2018
0 голосов
0 ответов

Я использовал следующее выражение для преобразования строк в столбцы в данных с использованием...

Rupa / 12 сентября 2018
0 голосов
0 ответов

У меня есть демо в качестве объекта модели Scala. и извлечение данных из кассандры и сохранение в...

shantha ramadurga / 12 сентября 2018
0 голосов
1 ответ

Я получаю правильное количество после запуска оператора ANALYZE.Но моя проблема в том, что его...

Sam / 12 сентября 2018
0 голосов
1 ответ

Мне нужно перебрать все столбцы, чтобы найти сходство значения 1 столбца.Например: ID,FN,LN,Phone...

Eyedia Tech / 12 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...