Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
0 ответов

(есть проблема с Apache Spark У меня есть кластер с 10 узлами (1 ведущим и 9 ведомыми), каждый узел...

Yacine Mohammed / 29 апреля 2018
0 голосов
0 ответов

Я бегу spark-submit для запуска в Kubernetes (Spark 2.3). Моя проблема в том, что InitContainer не...

joshuarobinson / 29 апреля 2018
0 голосов
1 ответ

men = data.flatMap(lambda x :x['text'].split(" ")) \ .filter(lambda x: len(x

Saurabh / 29 апреля 2018
0 голосов
1 ответ

У меня есть фрейм данных, который имеет несколько значений «None». После преобразования строковых...

Tomas Goffa / 29 апреля 2018
0 голосов
2 ответов

Мне нужно объединить комбинации гласных слов в текстовом файле, используя Scala. Например, если...

zach / 29 апреля 2018
0 голосов
0 ответов

У меня есть несколько тестовых случаев, таких как чтение / запись файла в HDFS, которые я хочу...

udit / 29 апреля 2018
0 голосов
1 ответ

Мне нужно записать во внешний кластер HDFS, данные аутентификации которого доступны как для простой...

A.G. / 29 апреля 2018
0 голосов
1 ответ

Я изучаю Scala и пытаюсь выяснить, как создать программу MapReduce в Scala, чтобы найти для каждого...

drizzle / 29 апреля 2018
0 голосов
2 ответов

Я хочу запустить эту программу. Я новичок в Scala Spark. У меня «ошибка компиляции» кто-нибудь...

AliSafari186 / 28 апреля 2018
0 голосов
2 ответов

Буду признателен, если вы поможете мне. Во время реализации потоковой передачи искры от kafka к...

feus.tigris / 28 апреля 2018
0 голосов
1 ответ

Используя новую функцию Spark 2.3.0, ImageSchema, я считал некоторые изображения в виде набора...

Soheil Pourbafrani / 28 апреля 2018
0 голосов
1 ответ

Теперь мне удалось запустить Pyspark в Jupyter в локальном режиме вторым способом, упомянутым в...

fuko / 28 апреля 2018
0 голосов
1 ответ

Один из столбцов в моем исходном файле данных содержит двойные кавычки ("), и когда я пытаюсь...

vp1008 / 28 апреля 2018
0 голосов
5 ответов

У меня есть датафрейм, как показано ниже - Id,timestamp 100,1 200,2 300,3 400,4 500,5 600,6 А...

Rajendra Jangir / 27 апреля 2018
0 голосов
2 ответов

У меня более 100 миллионов записей, хранящихся в файлах со следующей структурой JSON (реальные...

Dalphin / 27 апреля 2018
0 голосов
1 ответ

Я пытаюсь загрузить некоторые файлы в HDFS с использованием Scala. Тем не менее, я получаю ту же...

Miguel A. Friginal / 27 апреля 2018
0 голосов
2 ответов

Ну, название вопросов говорит само за себя. У меня есть требование, которое требует получения...

anir / 27 апреля 2018
0 голосов
2 ответов

Учитывая следующий DataFrame, нам нужно интерполировать my_column значения из примера и...

ivan_bilan / 27 апреля 2018
0 голосов
2 ответов

Я хочу проверить, является ли .csv null или нет. Если не null и содержит запись, обработайте файл,...

pooja / 27 апреля 2018
0 голосов
3 ответов

Мне нужен запрос, в котором перечислены уникальные Составные ключи разделов внутри Spark. Запрос в...

ChiMo / 27 апреля 2018
0 голосов
2 ответов

Я использую gradle для создания своего проекта, смешивающего Kotlin и Apache Spark, но как только я...

Jairo Andres Velasco Romero / 27 апреля 2018
0 голосов
1 ответ

Scala версии 2.11 и Spark 2.0.1. У меня есть датафрейм, где я делаю некоторые операции внутри udf....

Terry / 27 апреля 2018
0 голосов
1 ответ

при записи многораздельного набора данных в HDFS / S3 файл _SUCCESS записывается в выходной каталог...

femibyte / 26 апреля 2018
0 голосов
0 ответов

Я получил эту ошибку при попытке запустить «Как использовать MongoDB Hadoop Connector с Spark». на...

Hung Nguyen / 26 апреля 2018
0 голосов
0 ответов

Я пытаюсь записать данные с помощью PySpark с локального на удаленный сервер, и я получаю сообщение...

Praveen Mandadi / 26 апреля 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...