Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
3 ответов

Проработанный сценарий -> каталог HDFS, который «заполняется» новыми данными журнала о нескольких...

DigitalFailure / 22 октября 2018
0 голосов
1 ответ

У меня есть задание потоковой передачи, которое запускается на EMR, читает сообщения от Kafka и...

user2128732 / 22 октября 2018
0 голосов
1 ответ

Допустим, в mongodb есть коллекция "товаров", подобная этой: {name:"A"...

hometown / 22 октября 2018
0 голосов
0 ответов

У меня есть искровое задание, работающее в кластерном режиме, которое требует использования паролей...

vijay / 22 октября 2018
0 голосов
1 ответ

Моя Java-программа Spark принимает файл размером 3,7 ГБ.Когда я запускаю программу spark и захожу в...

user836087 / 21 октября 2018
0 голосов
1 ответ

При попытке создать поток из текстового файла в Pyspark появляется следующая ошибка: TypeError:...

Zeinab Akhavan / 21 октября 2018
0 голосов
1 ответ

проблема в том, что этот код прекрасно работает с python 2.xn. Новый python 3.5 в Apache позволяет...

Kamil Amin / 21 октября 2018
0 голосов
3 ответов

Я новичок в Spark и scala и работаю над простым примером WordCount. Так что для этого я использую...

KayV / 21 октября 2018
0 голосов
1 ответ
0 голосов
1 ответ

При перезапуске спарк кластера вся история завершенного приложения в веб-интерфейсе удаляется.Как я...

DAVID_ROA / 21 октября 2018
0 голосов
1 ответ

Я новичок в scala и spark, и у меня есть требование, в котором я хочу использовать формат и...

KayV / 21 октября 2018
0 голосов
0 ответов

У меня есть случай использования, когда я хочу зашифровать свои данные, когда я сохраняю данные в...

prady / 20 октября 2018
0 голосов
1 ответ

Я только начал изучать spark и scala и тестировать некоторые преобразования и действия с RDD. Я...

KayV / 20 октября 2018
0 голосов
1 ответ

Я хочу присоединиться к 3 tables, используя spark rdd.Я достиг своей цели, используя spark sql, но...

RushHour / 20 октября 2018
0 голосов
1 ответ

В настоящее время у меня есть задание ETL, которое читает несколько таблиц, выполняет определенные...

csingh1992 / 20 октября 2018
0 голосов
1 ответ

Вот датафрейм в искре +------+----+---+ | Close|sell|buy| +------+----+---+ | 314.6| 0| 1| | 120|...

Bingchen Liu / 20 октября 2018
0 голосов
2 ответов

Я использую Apache Spark и у меня есть фрейм данных, который выглядит следующим образом: scala>...

stackoverflowuser2010 / 19 октября 2018
0 голосов
1 ответ

Представьте два сценария в EMR: Запуск задания зажигания в локальном режиме на одном узле. Запуск...

FelipeKunzler / 19 октября 2018
0 голосов
0 ответов

используя это в качестве начальной команды ... PYSPARK_DRIVER_PYTHON=/opt/miniconda/bin/python...

Thom Rogers / 19 октября 2018
0 голосов
1 ответ

У меня есть опыт создания решений ETL на основе Azure Data Factory и Azure Data Lake Analytics...

Alex S / 19 октября 2018
0 голосов
0 ответов

Я использую https://github.com/holdenk/spark-testing-base для написания тестов JUnit. Проверьте...

Anthony Arrascue / 19 октября 2018
0 голосов
0 ответов

Я ежедневно принимаю данные из различных внешних источников, таких как GA, скребки, Google BQ и т....

Pyzo / 19 октября 2018
0 голосов
1 ответ

Я пытаюсь подсчитать для данного order_id, сколько заказов было за последние 365 дней, которые...

Siruphuhn / 19 октября 2018
0 голосов
1 ответ

Я работаю с Databricks и хочу получить список всех моих фреймов данных с их количеством наблюдений....

Alexandra Lorenzo / 19 октября 2018
0 голосов
0 ответов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...