Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
0 ответов

У меня есть конвейер с тем же входом (кэшированный фрейм данных), я меняю только один этап каждый...

sparkly / 10 июня 2018
0 голосов
1 ответ
0 голосов
0 ответов

Я пытаюсь записать фрейм данных pyspark в файл csv, но проблема, с которой я здесь сталкиваюсь,...

Jack / 10 июня 2018
0 голосов
2 ответов

Предположим, это мои данные: date value 2016-01-01 1 2016-01-02 NULL 2016-01-03 NULL 2016-01-04 2...

nik / 09 июня 2018
0 голосов
1 ответ

Есть ли способ получить Hadoop FileSystem от Spark Executor при выполнении операции mapPartitions...

miguel0afd / 09 июня 2018
0 голосов
2 ответов

Я пытаюсь прочитать json и разобрать два значения valueStr1 и valueStr2 из темы Кафки...

user3243499 / 09 июня 2018
0 голосов
1 ответ

Я пытаюсь прочитать CSV-файлы из определенной папки и записать то же содержимое в другой CSV-файл в...

Khan Hafizur Rahman / 09 июня 2018
0 голосов
0 ответов

Я должен вычислить собственное значение наименьшей величины и связанный с ним собственный вектор...

Gennaro / 09 июня 2018
0 голосов
0 ответов

Мой файл партера HDFS и таблица Cassandra содержат 70 миллионов строк, 16 столбцов и 14 столбцов в...

Chandan Ray / 09 июня 2018
0 голосов
1 ответ
0 голосов
1 ответ

У меня есть приложение Kafka и Spark для структурированной потоковой передачи.В частности, у меня...

Alberto / 09 июня 2018
0 голосов
2 ответов

Я пытаюсь прочитать данные из JSON, у которого есть массив, имеющий значения lat, long, что-то...

game_changer / 09 июня 2018
0 голосов
2 ответов

У меня есть датафрейм, где я хочу обрезать его по последнему появлению значения Good в столбце PDP

dsl1990 / 09 июня 2018
0 голосов
0 ответов

У меня есть тема на Кафке, которую я потребляю, и я использую from_json для преобразования...

Brian / 08 июня 2018
0 голосов
0 ответов

Я занимаюсь разработкой структурированного приложения Spark Stream, в котором после анализа я...

Khan Hafizur Rahman / 08 июня 2018
0 голосов
1 ответ

Рассмотрим этот простой пример dtrain <- data_frame(text = c("Chinese Beijing Chinese"...

ℕʘʘḆḽḘ / 08 июня 2018
0 голосов
0 ответов

У меня есть мульти-проект, созданный с использованием sbt, и я хотел бы создать исполняемый файл...

Cassie / 08 июня 2018
0 голосов
2 ответов

У меня есть переменная, объявленная следующим образом: val jobnameSeq = Seq( ("42409245",...

Kiwy / 08 июня 2018
0 голосов
1 ответ

У меня есть следующая строка в Java { "header": { "gtfs_realtime_version":...

Alberto / 08 июня 2018
0 голосов
1 ответ

Как мне обработать |, который также является разделителем в моих данных, Вот примерное значение...

Arjun / 08 июня 2018
0 голосов
1 ответ

Привет. Я пытаюсь отфильтровать эти триплеты по их свойствам и распечатать их, но у меня возникли...

gannina / 08 июня 2018
0 голосов
1 ответ

Предположим, у меня есть DataFrame со столбцом partition_id: n_partitions = 2 df = spark

abeboparebop / 08 июня 2018
0 голосов
0 ответов

YarnAllocator и Yarn Resource Manager действовали настолько щедро, что запросили и дали больше, чем...

minyo / 08 июня 2018
0 голосов
0 ответов

Я пытаюсь запустить программу в кластере, используя YARN. YARN присутствует там вместе с HADOOP....

Aakash Basu / 08 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...