Вопросы с тегом Апач-искра - PullRequest

Вопросы с тегом Апач-искра

0 голосов
0 ответов

Запустил приложение spark на AWS emr, используя YARN в кластерном режиме, используя конфигурацию c4

O.O / 06 сентября 2018
0 голосов
1 ответ

Я написал следующую функцию, которая объединяет две строки и добавляет их в новый столбец кадра...

scalacode / 06 сентября 2018
0 голосов
1 ответ

Я использую класс Spark mlib's BinaryClassificationMetrics для генерации метрик для вывода...

Tony / 06 сентября 2018
0 голосов
1 ответ

Я хочу запустить локальное задание Dynamodb без использования кластера EMR, которые читают данные...

Henbe / 05 сентября 2018
0 голосов
0 ответов

Я пытаюсь соединить три разных RDD на спарк, но выдает ошибку val name= sc

Rupesh Kumar / 03 сентября 2018
0 голосов
1 ответ

Я довольно новичок, чтобы зажечь. Сейчас я пытаюсь выяснить, возможно ли настроить искровой кластер...

user3605981 / 01 сентября 2018
0 голосов
1 ответ

Я столкнулся с одной проблемой при чтении паркета через искру. Один файл паркета был записан с...

Swapnil Chougule / 31 августа 2018
0 голосов
2 ответов

Возможно ли иметь один главный файл, в котором хранится список аргументов, на который можно...

user3243478 / 30 августа 2018
0 голосов
0 ответов
0 голосов
2 ответов

Я отправляю задания на спарк с помощью spark-submit в автономном режиме. Все эти задания...

bytewalker / 29 августа 2018
0 голосов
1 ответ

У меня большой объем данных, около 500 ТБ, мне нужно сделать несколько ETL для этих данных. Эти...

user3607698 / 28 августа 2018
0 голосов
1 ответ

У меня проблема с экспортом моей модели в PMML. моя модель использовала CrossValidatorModel, чтобы...

Miguel A. Friginal / 06 июля 2018
0 голосов
0 ответов

Я использовал KMeans, чтобы разделить свои элементы на наборы кластеров, а затем внутри каждого...

proximator / 05 июля 2018
0 голосов
1 ответ

Я хотел бы использовать EMR и Spark для обработки отчета об инвентаризации AWS S3, сгенерированного...

rmberg / 03 июля 2018
0 голосов
1 ответ

Возможно ли найти метрики ошибок (точность и отзыв) в задаче классификации мультикласса в Apache...

Rajnil Guha / 02 июля 2018
0 голосов
0 ответов

Запуск заданий в кластере spark 2.3, я заметил в веб-интерфейсе spark, что разлив происходит для...

user4640449 / 29 июня 2018
0 голосов
1 ответ

У меня есть два абсолютно одинаковых кадра данных для сравнительного теста df1...

Misha / 29 июня 2018
0 голосов
1 ответ

Я пишу приложение Spark Streaming, в котором входные данные помещаются в корзину S3 небольшими...

lfk / 25 июня 2018
0 голосов
1 ответ

Я пытаюсь прочитать данные из "s3: //fakePath/subFakePath/sub-sub-FakePath/*.gz" в искру,...

Sandeep / 09 июня 2018
0 голосов
1 ответ

Давайте рассмотрим набор данных с простым отношением «многие ко многим»: банковские счета, которые...

RomainC / 06 июня 2018
0 голосов
1 ответ

Привет, ребята, Мой вопрос о ноутбуке Zeppelin.Я новичок в среде Zeppelin.У меня есть аккаунт AWS.Я...

Bugs_Bunny / 04 июня 2018
0 голосов
2 ответов

В этом предыдущем вопросе я пытался избежать проблем с памятью с Spark join, избегая использования...

Thomas W / 29 мая 2018
0 голосов
0 ответов

Я хочу вывести схему из большого набора данных (скажем, данные за 6 месяцев) и использовать ее для...

Vijay Muvva / 29 мая 2018
0 голосов
1 ответ
0 голосов
1 ответ

Моя платформа - spark 2.1.0, использующая язык Python. Теперь у меня есть около 100 моделей...

Guanglin Zhou / 27 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...